苹果公布AI大模型研发进展，执行性能优于GPT-4丨阿里云启用首个「AI001号」AI员工丨昆仑万维AI音乐生成模型开启邀测

2025-04-17 16:43:33 | 来源: AICG工具箱

2024年4月3日报道丨AI资讯早报

苹果公司正在积极投入AIGC赛道的研发工作，确保赶在今年6月WWDC开发者大会之前交出满意的答卷。

近日，苹果研究人员发布了一份论文，阐述他们正在开发一种新的AI交互系统——ReALM。该系统可以理解手机屏幕上实体、对话和背景上下文的模糊信息引用，从而实现与人工智能语音助手更自然地交互方式。

ReALM的一项关键创新是使用解析的屏幕上实体及其位置来重建屏幕的信息流逻辑，以生成捕获视觉布局的文本内容。研究人员证明，这种方法与专门用于参考解析的微调语言模型相结合，该任务的执行效率理论上是优于GPT-4的。

苹果研究人员在论文中写道：“让用户能够对屏幕上看到的内容发出查询指令，是确保人工智能语音助手真正实现免提交互体验的关键一步。”

今天，阿里云宣布为AI智能编程助手「通义灵码」分配了一个正式的员工工号：AI001。同时，阿里云正在内部全面推行AI编程，使用通义灵码辅助程序员写代码、读代码、查BUG、优化代码等。

阿里云专门阿里云相关人士透露：“公司未来将有20%的代码将由「通义灵码」AI程序员进行编写，但人类程序员仍然是研发的核心，他们将有更多时间专注于系统设计以及核心业务开发工作。”

当地时间4月1日，据The Information报道，根据新递交的证券备案文件，OpenAI CEO奥特曼已经不再具有OpenAI风险投资部门（OpenAI Startup Fund）旗下的投资基金的控制资格。

伊恩·海瑟薇（Ian Hathaway）自2021年起担任该基金的投资项目合伙人，目前是唯一被列为OpenAI风投基金的普通合伙人和基金经理的个人。此举意在将奥特曼对公司的控制权进一步剥离，避免陷入OpenAI独揽大权的局面。

当地时间4月1日，据《华尔街日报》报道，有业内人士分析，目前公开的互联网上，已有信息对于各大AI大模型研究公司进行大模型的训练已经不够用，他们正在寻找未开发的信息源，并重新思考如何训练这些系统。

据知情人士透露，为了训练更强大的多模态大模型，OpenAI内部已经在讨论已经讨论了根据YouTube公共视频的转录来训练其下一代模型GPT-5，并且正在尝试使AI生成的或合成的数据作为训练材料。

4月2日，昆仑万维旗下首个AI音乐生成大模型——天工SkyMusic，目前正在面向社会音乐人进行广泛地免费邀测。这是国内首个基于音乐作品生成的AI大模型，并且是免费提供。该公司计划在4月17日的「天工3.0」发布会上正式对外公布。

天工SkyMusic基于昆仑万维天工3.0超级大模型打造，可以生成80秒44100Hz采样率双声道立体声AI歌曲，并可根据用户输入的歌词风格生成对应歌曲风格；实现AI人声合成；通过歌词控制歌曲，体现出主歌和副歌、前奏和主歌的段落差异；支持说唱、民谣、放克、古风、电子等多种音乐风格。

昆仑万维SkyMusic本轮邀测将开放1000个免费名额，天工SkyMusic正式版将在4月17日随「天工大模型3.0」面向全社会免费开放。

热门榜单

热门资讯