Tech Blog
  • Home
  • Archives
  • Categories
  • Tags
  • About
  • contact

PaLM-E解读

PaLM-E Modelfor roboticsgenerally-capable vision-and-language model可用于视觉任务如:描述图片、目标检测、场景分类,也可用于文本任务如:解数学题、生成代码等。 PaLM-E
2025-03-23
Research > AI > Robotics
#AI #NLP #Research #Robotics #ComputerVision

OpenVLA:开源视觉-语言-动作模型解读

论文解读OpenVLA模型Prismatic-7B VLM 关键组件视觉编码器投影器视觉特征映射到语言嵌入空间 LLM骨干微调数据集Open X-Embodiment:包含 970k 个机器人操作轨迹,涵盖多种机器人形态、任务和场景。 微调方法:Lora推理量化推理局限性仅支持单图输入推理吞吐量有限在测试任务的成功率低于90%,可靠性有待提升参考文献 项目主页: OpenVLA 代码仓库: Git
2025-03-23
Research > AI > Robotics
#AI #NLP #Research #Robotics #ComputerVision

QuasiSim: Quasi-Physical Simulators for Dexterous Manipulations Transfer

参考文献QuasiSim: Quasi-Physical Simulators for Dexterous Manipulations Transfer
2025-03-23
Research > AI > Robotics
#AI #NLP #Research #Robotics #ComputerVision

RDT-1B:双手操作的扩散基础模型解读

RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION参考文献RDT-1B: A Diffusion Foundation Model for Bimanual Manipulation
2025-03-22
Research > AI > Robotics
#AI #Research #Robotics #ComputerVision #DiffusionModels

灵巧手:UniDexGrasp论文解读

UniDexGrasp: 统一框架下的机器人灵巧抓取摘要机器人灵巧抓取是机器人学和人工智能领域的重要研究方向。本文将详细解读UniDexGrasp论文,这是一个面向多样化物体的统一灵巧抓取框架。UniDexGrasp通过结合视觉感知、触觉反馈和强化学习,实现了对未知物体的鲁棒抓取能力,大幅提升了机器人在复杂环境中的操作能力。 引言二指夹爪的局限性: 目标:学习一个通用的灵巧手抓取方法,在仿真环境泛
2025-03-22
DeepLearning > AI > Robotics
#AI #Robotics #DeepLearning #Robot #Grasping

Yell at your robot论文解读与复现

2025-03-22
DeepLearning > AI > Robotics
#AI #Robotics #DeepLearning #Robot #Grasping

GAN神经网络

生成对抗网络(GAN)简介生成对抗网络(Generative Adversarial Networks,简称GAN)是一种深度学习模型,由Ian Goodfellow和他的同事们于2014年提出。GAN由两个神经网络组成:生成器(Generator)和判别器(Discriminator),这两个网络相互对抗,通过博弈过程来提高彼此的能力。 GAN的工作原理GAN的工作原理可以类比为一个伪造者和一
2025-03-14
DeepLearning > AI
#AI #DeepLearning #Image #Neural Networks

基于Dify搭建智能体:构建自定义AI应用的实践指南

基于Dify搭建智能体:构建自定义AI应用的实践指南 引言随着大语言模型(LLM)技术的迅速发展,构建自定义AI应用变得越来越重要。Dify作为一个开源的LLM应用开发平台,提供了便捷的工具来创建、部署和管理AI应用。本文将分享如何利用Dify平台构建智能体,无需深厚的编程背景即可打造功能强大的AI应用。 Dify平台简介Dify是一个LLM应用开发平台,支持从构思到部署的全流程开发。它的核心特
2024-11-15
AI > 开发工具
#AI #LLM #实践 #Dify #智能体

大模型注册管理:MLflow与Kubeflow实践指南

大模型注册管理:MLflow与Kubeflow实践指南在大模型开发与部署的生命周期中,模型注册管理是确保模型可追踪性、可重复性和治理的关键环节。本文将介绍两个主流的开源工具:MLflow和Kubeflow,它们如何帮助团队有效管理大模型资产。 MLflow:轻量级模型管理平台MLflow是由Databricks开源的端到端机器学习生命周期平台,专注于解决机器学习开发过程中的实验跟踪、可重现性和模型
2024-05-02
大模型 > MLOps
#大模型 #MLflow #Kubeflow #模型注册 #MLOps

数字化文档:企业转型的核心驱动力

数字化文档:企业转型的核心驱动力检测布局检测PDF文件布局(DocLayout-YOLO)检测行内公式布局(YOLOv8)支持解析PDF、PPT等 检测公式教育场景教育场景相比通用场景需要额外解决的挑战是什么?Versatile-OCR-Program给出的解决方案,相比较其他PDF读取工具有何优势? 视觉Agent方案##Agentic Document Extraction 核心功能可视化定位
2023-08-20
数字化 > 企业管理
#数字化转型 #文档管理 #企业效率 #知识管理 #协作工具
1…8910

Search

Hexo Fluid