Tech Blog

大模型后训练：方法与实践分析

大模型后训练：方法与实践分析引言大模型的后训练（Post-training）是指在大规模预训练之后，针对特定能力或任务进行的额外训练过程。通过后训练，模型可以获得调用插件的能力、支持MCP（Multi-turn Conversation Protocol）等特定功能，从而提升模型在实际应用中的表现。本文将详细介绍大模型后训练的常用方法，并深入分析DeepSeek的后训练实践。后训练方法概述后训练

2025-04-18

人工智能 > 大模型技术

#大模型 #后训练 #DeepSeek #微调 #MCP

使用Cursor实现NLP标注工具

常见问题测试‘’’对实现的功能，给出测试数据样例，并进行测试’’’ Cursor工具使用问题Cursor的问题问Cursor，往往比Google效果好。可以直接截图提问。比如：资源管理器（展示项目文件列表等）关闭，不知道如何打开，甚至不清楚正确的名称和问题，可以直接截图提问。依赖索引库mac pro m1安装faiss索引github下载源码编译后安装参考https://www.youtube

2025-04-18

开发工具

#AI工具 #Cursor #NLP

使用Cursor AI实现微信小程序开发

微信小程序开发环境搭建1. 安装必要工具下载【微信小程序开发工具】和【cursor】。 2. 创建小程序项目使用Cursor AI开发小程序步骤：使用kimi生成小程序PRD 1. 项目结构设计2. 页面开发3. 组件开发实践与技巧陷入修复bug云控函数 webAPI数据加密参考https://www.youtube.com/watch?v=87jXLqMIeDE

2025-04-18

开发工具 > 前端开发

#AI工具 #Cursor #小程序开发 #微信小程序

企业部署RAG系统的10条经验教训

现在存在 AI Context 悖论：LLM 在复杂推理、综合信息、代码生成、数学计算等方面表现惊人（对人类“难”），但在理解和应用特定上下文信息 (Context) 方面却很困难，而这恰恰是人类凭直觉和专业知识能轻松做到的。企业要实现从 AI 中获得差异化价值和业务转型（而不仅仅是便利性或效率提升），就必须依赖于深度、准确的企业上下文信息。目前大多数应用还停留在低上下文信息需求的“便利性”阶

2025-04-16

AI > 企业应用

#大模型 #RAG #企业AI #最佳实践

家庭教育中的奖励与惩罚：平衡发展的艺术

“学有余力”是孩子教育的关键。避免因为过度的学业压力失去好奇心和探索的动力。家庭教育采取反向用力：（1）学校压力本身已经很大，家里要多给孩子释放压力；（2）家庭成为孩子放松和探索兴趣的空间。教育资源的选择和组合：中等学校可能是个不错的选择，宁当鸡头不当凤尾。从小学会价值交换，学会商业的本质孩子在嵌入社会规则的同时，保留自我独立性。艺术与审美教育的重要性。艺术教育不仅培养技能，更重要的是

2025-04-16

教育 > 家庭成长

#教育 #家庭教育 #亲子关系

Agent实战应用

Agent框架实战应用本文介绍两个流行的Agent框架——CrewAI和Flowise的实际应用案例，重点展示多Agent协作场景的实现方法和效果。 CrewAI多AI Agents实战CrewAI是一个专为构建和编排多Agent系统设计的框架，它简化了多个智能体之间的协作流程，使开发者能够轻松创建复杂的多智能体应用。房地产投资分析案例下面展示一个房地产投资分析应用，通过多个专家Agent协作完

2025-04-16

AI > 应用实践

#AI #Agent #实践

SimAgent: 基于Genesis-World的机器人仿真数据自动化生成系统

SimAgent: 基于Genesis-World的机器人仿真数据自动化生成系统背景与挑战机器人训练，特别是涉及操作多样物体的任务，需要大量高质量的数据支持。然而，在现实世界中收集这些数据不仅耗时费力，还面临以下挑战：样本多样性受限：现实环境中难以覆盖所有可能的物体变体和交互场景数据标注成本高：物理世界的数据需要大量人工标注工作失败场景重现困难：现实中的失败案例难以系统性地复现和分析硬件

2025-04-15

机器人技术 > 仿真系统

#机器人 #仿真 #Agent #Genesis-World #数据生成

Genesis_World: 高级机器人仿真环境与应用

Genesis_WorldGenesis_World是一个先进的机器人仿真环境，为人形机器人和灵巧手的研究与开发提供了高保真的仿真平台。公开数据集 Partnet Objaverse：https://objaverse.allenai.org/ DeepMind Models：https://github.com/google-deepmind/mujoco_menagerie/blob/mai

2025-04-15

机器人技术 > 仿真系统

#机器人 #仿真 #Genesis-World #数据生成 #强化学习

多智能体协作

单Agent框架VS多Agent框架单Agent框架，主要关注智能体的感知、决策、学习，不涉及多个智能体的交互。开发单智能体的常用策略包括：（1）LLM配备工具调用能力，如代码执行器、web浏览器等；（2）通过提示策略获取更好的推理和规划能力，提示策略包括：思维链提示、ReAct、少样本提示等。多智能体系统在各个领域已展现出显著的成就，通过利用专业智能体之间的协作与协调来增强单个 LLM 的能力

2025-04-11

AI

#AI

构建索引

简介构建索引全量索引实时索引实时索引构建的流程根据段生命周期选择合并方式文档去重（主键索引）重分配文档ID 合并正排、倒排、删除表、主键索引写配置文件合并段策略内存段合并内存段生命周期提升内存段生命周期提升，转为磁盘段内存段、磁盘段合并磁盘段合并

2025-04-10

技术 > 搜索引擎

#搜索 #信息检索 #机器学习