2025-06-04 13:35:29 | 来源: AICG工具箱
6月14日报道 | 微软研究人员最近展示了LLaVA-Med模型,该模型是专为生物医学研究而设计的人工智能模型。它利用生物医学图像,如CT和X光图像等,推测患者的病理状况。微软与一批医院合作,获得了大量的生物医学图像和对应的文本数据集,用于训练这个多模态AI模型。
视觉指令调整,在生物医学领域构建具有 GPT-4级别功能的大型语言和视觉模型。6月1日在GitHub上发布了LLaVA-Med: Large Language and Vision Assistant for Biomedicine,这使得模型能够生成与图像相关的问答,并能够以自然语言回答有关生物医学图像的问题,实现了助手的愿景。
LLaVA-Med模型是基于GPT-4、Vision Transformer和Vicuna语言模型的。微软研究人员使用了八个英伟达A100 GPU对模型进行训练,其中包含每个图像的所有预分析信息。LLaVA-Med 使用通用模型 LLaVA 进行初始化,然后以课程学习方式不断进行训练(首先是生物医学概念对齐,然后是全面的指令调整)。并评估了 LLaVA-Med 在标准视觉对话和问答任务上的表现。
在训练过程中,LLaVA-Med模型主要关注描述图像内容以及阐述生物医学概念(即从图像中判断是什么)。微软表示,该模型在多模态对话能力方面表现出色,并在用于回答视觉问题的三个标准生物医学数据集上,在部分指标上领先于其他先进模型。
然而,微软的研究团队也指出,LLaVA-Med模型目前仍存在一些不足之处。这些包括大模型常见的虚假举例和准确度不佳的问题。研究团队表示,他们将致力于改善模型的质量和可靠性,以便将来能够在商业生物医学领域应用该模型。
尽管LLaVA-Med模型还存在改进空间,但它代表了构建有用的生物医学视觉助手迈出的重要一步。随着微软和其他研究机构的努力,相信在不久的将来,这样的模型将能够为医学界提供更准确、高效的病理分析和诊断服务。
热门榜单
快影
常用AI小冰岛
常用AI通义万相
常用AIDALL·E 3
常用AIPika AI
常用AI猫箱
常用AIWink Studio
常用AI讯飞同传
常用AI夸克扫描王
常用AI热门资讯
TensorRT插件安装_TensorRT插件怎么提升SD生图速度_stable diffusion插件
05-08神州问学深入大模型微调技术研究,小参数的模型在特定任务场景中表现超越大模型
01-31DeepL推出新一代翻译编辑大模型:翻译质量超越竞争对手谷歌微软ChatGPT
02-13落地发绿卡?微软加速AI团队撤出中国,加码布局投资东南亚市场
03-27微软Build 2024发布Copilot多项服务升级丨通义主力大模型API定价暴降97%丨文心大模型两大主力模型API免费
03-27vivo发布行业首个视障人士辅助多模态大模型,AI智能识别物体,为视障人士开启智能“电子眼睛”
03-28三星新一代旗舰手机Galaxy S24遭到沃尔玛「意外」提前上架:主打AI翻译功能,搭载高通骁龙8 Gen 3处理器
05-03开源版Gemini诞生_全能多模态模型Emu2登热榜_最新Emu2
05-03「微信AI」功能终于要来了:腾讯官宣2024微信公开课PRO定于1月11日开讲,还携手OPPO战略合作
05-03当闭环王者进入开源世界:苹果发布开源多模态大模型Ferret,可用于精准识别与定位图像里边的物体
05-04