跳到主要内容

大模型基础认知

认知起点

什么是大模型?

核心原理:预测下一个词

给定一段文本,模型会根据已学习的语料,预测最可能出现的下一个词。通过「超大规模语料 + 海量参数」的训练,模型获得了强大的语言理解和生成能力。

大模型能做什么?

场景说明
文本生成写作、翻译、摘要
代码辅助补全、调试、解释
问答对话知识问答、客服
逻辑推理数学题、逻辑分析

核心概念

Token:计费的基本单位

Token = 大模型处理文本的基本单位

语言换算规则
英文1 Token ≈ 4 字符 ≈ 0.75 单词
中文1 Token ≈ 1-2 汉字

为什么 Token 很重要?

  1. 计费依据:API 按 Token 计费,输入/输出分别计价
  2. 上下文限制:模型有最大容量(如 GPT-5: 128K tokens)
  3. 成本控制:精炼 Prompt 可以省钱

快速估算

  • 中文:字数 × 0.5 ~ 1
  • 英文:字数 × 0.25

API-Key:数字通行证

API-Key = "身份证 + 银行卡密码" (sk-xxxxx...)

功能说明
🆔 身份识别告诉服务器 "我是谁"
🛡️ 权限控制你能调用哪些模型/额度
💳 计费绑定产生的费用算在谁头上
安全性警示

严禁泄露 API-Key! 切勿直接上传到 GitHub 或贴到公开群聊。如泄露,立即删除 Key 并重新生成。

环境变量配置

# .env 文件示例
OPENROUTER_API_KEY=sk-or-v1-xxxxxxxxxxxxxxxx
DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxx
DASHSCOPE_API_KEY=sk-xxxxxxxxxxxxxxxx
from dotenv import load_dotenv
import os

load_dotenv(override=True)
api_key = os.getenv("DEEPSEEK_API_KEY")

SDK:开发者的"万能遥控器"

SDK (Software Development Kit) 是封装好的工具包,不需要懂底层 HTTP 协议。

为什么都兼容 OpenAI 格式?

OpenAI 在 2020 年发布 GPT-3 API 时设计了一套简洁的调用接口,逐渐成为行业事实标准。DeepSeek、阿里百炼、智谱AI、OpenRouter 都支持这套格式。

# 切换平台只需改两个配置
client = OpenAI(
api_key=api_key,
base_url="https://api.deepseek.com" # 平台地址
)
response = client.chat.completions.create(
model="deepseek-chat" # 模型名称
)

全球局势速览

两条主线:闭源 vs 开源

维度闭源 (Closed)开源 (Open)
核心代码/权重不公开权重完全公开
模式付费 API 调用私有部署
代表OpenAI, Google, AnthropicLLaMA, DeepSeek, Qwen
比喻可口可乐:能喝但不知道配方Linux:完全公开,可魔改

三类接入渠道

渠道特点适合人群
原厂云平台版本最新、功能最全极客
聚合平台一站式购齐,一个 Key 调所有开发者
国内云厂商合规,数据不出境,有售后企业

五大趋势

  1. 开源模型崛起:DeepSeek、LLaMA 性能直追闭源
  2. 价格战激烈:API 价格持续下降
  3. 聚合平台流行:OpenRouter 等中转服务兴起
  4. 合规要求加强:数据安全成为重点
  5. 多模态发展:图像、音频、视频能力增强

平台快速接入

OpenRouter:突破封锁的中转平台

核心优势说明
🔑 One Key For All一个 Key 调用全球主流模型
🚀 超低门槛无需海外手机号、信用卡
🆓 免费模型库提供大量免费模型
注意

使用 OpenRouter 调用 GPT/Claude 系列模型需要开启科学上网(美国节点)。


DeepSeek:性价比之王

模型价格适用场景
deepseek-chat1 元 / 百万 Token日常对话、翻译
deepseek-reasoner4-8 元 / 百万 Token数学、代码、复杂推理
  • 官网:platform.deepseek.com
  • 新用户送 10 元(约 500 万 Token)

阿里百炼(通义千问)

智谱 AI(GLM)


平台选择建议

场景推荐平台
个人学习、练手DeepSeek / OpenRouter
企业生产环境阿里百炼 / 智谱 AI
体验 GPT/ClaudeOpenRouter(需翻墙)

快速开始

环境准备

pip install openai python-dotenv

核心代码结构

from openai import OpenAI

client = OpenAI(
api_key="你的API Key",
base_url="平台地址",
model="模型名称"
)
response = client.chat.completions.create(
model="deepseek-chat",
messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

核心参数

参数说明常用值
temperature输出随机性 (0=确定, 2=创意)0.7
max_tokens最大输出 Token 数500

进阶功能(概念)

  • 多轮对话:传递历史消息列表维持上下文
  • Function Calling:让 AI 调用外部函数/工具
  • 多模态输入:支持图片理解(GPT-4o 等)
  • 流式输出:打字机效果,提升体验

成本控制

  • 按 Token 计费,输入/输出分别计价
  • 善用缓存命中可大幅降低成本
  • 免费额度:DeepSeek 送 10 元,智谱 AI 送 2000 万 Token

相关资源