AI应用开发工程师必懂常识

常用大模型

名称 描述
DeepSeek V3 深算科技开发的大语言模型,主要用于中文场景,具有强大的文本生成和理解能力。
DeepSeek R1 深算科技开发的另一款大语言模型,可能专注于特定领域的应用或优化。
Qwen3 阿里云研发的通义千问系列第三代大语言模型,支持多语言、多任务处理。
GPT-5 OpenAI 发布的最新一代旗舰模型,具备强大的高级推理和逻辑处理能力。
Gemini 2.5 Pro 谷歌 Gemini 系列最先进的模型,能够处理代码、数学等领域的复杂问题。
Llama 4 Meta 发布的第四代多模态开源模型,采用混合专家架构,提升了图像和文本理解能力。

大模型分类

名称 描述
LLM Large Language Model(大语言模型),基于大规模参数训练的语言模型,擅长理解和生成自然语言。
VLM Visual Language Model(视觉语言模型),结合图像和语言理解能力的模型,能处理图文混合输入。
多模态大模型 Multimodal Large Model,能够同时处理文本、图像、音频等多种数据类型的模型。

AI 分类

名称 描述
生成式 AI Generative AI,能够生成新内容(如文本、图像、音频)的人工智能技术。
分析式 AI Analytical AI,用于分析已有数据并提取信息或做出预测的人工智能技术。

通用技术

名称 描述
Function call 函数调用,指大模型调用外部工具或 API 来完成特定功能的能力。
MCP Model Context Protocol(模型上下文协议),一种标准化模型与外部系统交互的开放协议。
RAG Retrieval-Augmented Generation(检索增强生成),通过结合知识库检索提升模型输出准确性的技术。
Embedding 嵌入,将数据(如文本)转化为向量形式,便于模型进行语义计算和匹配。
Prompt 提示词,提供给模型的输入指令,引导其生成期望的输出。
Agent 智能体,具备自主决策能力的程序实体,可执行复杂任务流程。
Fine-tuning 微调,在预训练模型基础上针对特定任务进一步训练以提升性能。
Text2SQL 文本到 SQL 转换技术,将自然语言查询自动翻译为结构化数据库查询语句。

辅助工具

名称 描述
Cursor 一款基于 AI 的编程助手,支持代码生成、调试和优化。
Trae AI 编程辅助工具,帮助开发者提高编码效率。
CodeBuddy AI 编程助手,提供代码建议、错误检测和修复建议。
Copilot GitHub Copilot,由 GitHub 和 OpenAI 合作推出的 AI 编程辅助工具。
Coze AI 应用构建平台,支持快速创建个性化 AI 助手。
Dify 低代码/无代码 AI 应用开发平台,支持自定义大模型应用部署。
LangChain 一个用于构建大语言模型应用的开源框架,支持链式调用和模块化设计。
Mineru MinerU 是一款将 PDF 转化为机器可读格式的工具(如 markdown、json),可以很方便地抽取为任意格式。

AI 智能体分类

名称 描述
反应式 Reactive Agent,仅根据当前输入做出反应,不具备记忆或规划能力。
深思熟虑式 Reflective Agent,具备历史记忆和推理能力,可以进行策略性思考。
混合式 Hybrid Agent,结合反应式与深思熟虑式的优势,兼具实时响应与长期规划能力。

向量数据库

名称 描述
Milvus 一个开源的向量数据库,专为高效存储和检索高维向量数据设计,广泛应用于推荐系统、图像检索等场景。
Faiss Facebook AI 开发的高效向量相似度搜索库,支持大规模向量检索。
Elasticsearch 分布式搜索引擎,支持全文检索和向量搜索功能。

需要安装下载哪些工具?这些工具是干什么的?如何进行下载?

AI 编程工具 : Cursor、Trae、Codeboddly、Copilot 中任选其一。

  • Cursor 安装地址https://www.cursor.com/ 下载对应操作系统环境的版本(比如 windows 的版本);下载后按照常规步骤自行安装;安装完成后,在 File => Preferences => Extensions(插件) 中查找 Python,安装 Python 插件,即可在 Cursor 中使用 Python。

需要注册哪些网站的账号?如何进行注册?(如阿里云百炼、dashscope)

大家可以提前注册阿里云百炼,获取 dashscope apikey,用于后续的使用。
方法:登录 阿里云百炼 完成认证后,在左下角有 API-Key,创建我的 API-Key 即可。

哪些网站注册需要科学上网?

AI 相关框架有哪些?(如 vllm、qwen-agent、ollama、langchain、langgraph、graphrag、vanna、chatglm、qwen_vl)这些框架都是干什么的?

  1. agent 搭建框架
    • langchain、langgraph、qwen-agent、coze、dify
  2. 模型部署框架
    • ollama、vllm
  3. 大模型
    • qwen3、qwen-vl、chatglm
  4. 知识图谱 RAG
    • graphrag
  5. text2sql 工具
    • vanna
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容