医疗 AI 迎来大考,南洋理工发布首个 LLM 电子病历处理评测

南洋理工大学研究人员构建了 EHRStruct 基准,用于评测 LLM 处理结构化电子病历的能力。该基准涵盖 11 项核心任务,包含 2200 个样本,按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型,数据驱动任务表现更强,输入格式和微调方式对性能有显著影响。基于此,团队提出 EHRMaster 框架,与 Gemini 联合后性能超越现有模型。...
人工智能 2025-12-15 0

OpenAI:人类打字速度将成通用人工智能发展瓶颈

OpenAI Codex产品负责人Alexander Embiricos表示,人类的打字速度将成为通用人工智能(AGI)发展的瓶颈。他认为,人类需要通过写提示词和验证AI输出结果,限制了AGI的发展速度。解决方案是让智能体默认发挥作用,实现“曲棍球杆式增长”。#人工智能 #AGI...
人工智能 2025-12-15 0