Tech Blog
  • Home
  • Archives
  • Categories
  • Tags
  • About
  • contact

大模型后训练:方法与实践分析

大模型后训练:方法与实践分析引言大模型的后训练(Post-training)是指在大规模预训练之后,针对特定能力或任务进行的额外训练过程。通过后训练,模型可以获得调用插件的能力、支持MCP(Multi-turn Conversation Protocol)等特定功能,从而提升模型在实际应用中的表现。本文将详细介绍大模型后训练的常用方法,并深入分析DeepSeek的后训练实践。 后训练方法概述后训练
2025-04-18
人工智能 > 大模型技术
#大模型 #后训练 #DeepSeek #微调 #MCP

使用Cursor实现NLP标注工具

常见问题测试‘’’对实现的功能,给出测试数据样例,并进行测试’’’ Cursor工具使用问题Cursor的问题问Cursor,往往比Google效果好。可以直接截图提问。比如:资源管理器(展示项目文件列表等)关闭,不知道如何打开,甚至不清楚正确的名称和问题,可以直接截图提问。 依赖索引库mac pro m1安装faiss索引github下载源码编译后安装 参考https://www.youtube
2025-04-18
开发工具
#AI工具 #Cursor #NLP

使用Cursor AI实现微信小程序开发

微信小程序开发环境搭建1. 安装必要工具下载【微信小程序开发工具】和【cursor】。 2. 创建小程序项目使用Cursor AI开发小程序步骤: 使用kimi生成小程序PRD 1. 项目结构设计2. 页面开发3. 组件开发实践与技巧陷入修复bug云控函数 webAPI数据加密 参考https://www.youtube.com/watch?v=87jXLqMIeDE
2025-04-18
开发工具 > 前端开发
#AI工具 #Cursor #小程序开发 #微信小程序

企业部署RAG系统的10条经验教训

现在存在 AI Context 悖论:LLM 在复杂推理、综合信息、代码生成、数学计算等方面表现惊人(对人类“难”),但在理解和应用特定上下文信息 (Context) 方面却很困难,而这恰恰是人类凭直觉和专业知识能轻松做到的。 企业要实现从 AI 中获得差异化价值和业务转型(而不仅仅是便利性或效率提升),就必须依赖于深度、准确的企业上下文信息。目前大多数应用还停留在低上下文信息需求的“便利性”阶
2025-04-16
AI > 企业应用
#大模型 #RAG #企业AI #最佳实践

家庭教育中的奖励与惩罚:平衡发展的艺术

“学有余力”是孩子教育的关键。避免因为过度的学业压力失去好奇心和探索的动力。 家庭教育采取反向用力:(1)学校压力本身已经很大,家里要多给孩子释放压力;(2)家庭成为孩子放松和探索兴趣的空间。 教育资源的选择和组合:中等学校可能是个不错的选择,宁当鸡头不当凤尾。 从小学会价值交换,学会商业的本质 孩子在嵌入社会规则的同时,保留自我独立性。 艺术与审美教育的重要性。艺术教育不仅培养技能,更重要的是
2025-04-16
教育 > 家庭成长
#教育 #家庭教育 #亲子关系

Agent实战应用

Agent框架实战应用本文介绍两个流行的Agent框架——CrewAI和Flowise的实际应用案例,重点展示多Agent协作场景的实现方法和效果。 CrewAI多AI Agents实战CrewAI是一个专为构建和编排多Agent系统设计的框架,它简化了多个智能体之间的协作流程,使开发者能够轻松创建复杂的多智能体应用。 房地产投资分析案例下面展示一个房地产投资分析应用,通过多个专家Agent协作完
2025-04-16
AI > 应用实践
#AI #Agent #实践

SimAgent: 基于Genesis-World的机器人仿真数据自动化生成系统

SimAgent: 基于Genesis-World的机器人仿真数据自动化生成系统背景与挑战机器人训练,特别是涉及操作多样物体的任务,需要大量高质量的数据支持。然而,在现实世界中收集这些数据不仅耗时费力,还面临以下挑战: 样本多样性受限:现实环境中难以覆盖所有可能的物体变体和交互场景 数据标注成本高:物理世界的数据需要大量人工标注工作 失败场景重现困难:现实中的失败案例难以系统性地复现和分析 硬件
2025-04-15
机器人技术 > 仿真系统
#机器人 #仿真 #Agent #Genesis-World #数据生成

Genesis_World: 高级机器人仿真环境与应用

Genesis_WorldGenesis_World是一个先进的机器人仿真环境,为人形机器人和灵巧手的研究与开发提供了高保真的仿真平台。 公开数据集 Partnet Objaverse:https://objaverse.allenai.org/ DeepMind Models:https://github.com/google-deepmind/mujoco_menagerie/blob/mai
2025-04-15
机器人技术 > 仿真系统
#机器人 #仿真 #Genesis-World #数据生成 #强化学习

多智能体协作

单Agent框架VS多Agent框架单Agent框架,主要关注智能体的感知、决策、学习,不涉及多个智能体的交互。开发单智能体的常用策略包括:(1)LLM配备工具调用能力,如代码执行器、web浏览器等;(2)通过提示策略获取更好的推理和规划能力,提示策略包括:思维链提示、ReAct、少样本提示等。 多智能体系统在各个领域已展现出显著的成就,通过利用专业智能体之间的协作与协调来增强单个 LLM 的能力
2025-04-11
AI
#AI

构建索引

简介构建索引全量索引实时索引实时索引构建的流程 根据段生命周期选择合并方式 文档去重(主键索引) 重分配文档ID 合并正排、倒排、删除表、主键索引 写配置文件 合并段策略 内存段合并 内存段生命周期提升 内存段生命周期提升,转为磁盘段 内存段、磁盘段合并 磁盘段合并
2025-04-10
技术 > 搜索引擎
#搜索 #信息检索 #机器学习
1…34567…10

Search

Hexo Fluid