2025-04-17 16:43:33 | 来源: AICG工具箱
2024年4月3日报道丨AI资讯早报
苹果公司正在积极投入AIGC赛道的研发工作,确保赶在今年6月WWDC开发者大会之前交出满意的答卷。
近日,苹果研究人员发布了一份论文,阐述他们正在开发一种新的AI交互系统——ReALM。该系统可以理解手机屏幕上实体、对话和背景上下文的模糊信息引用,从而实现与人工智能语音助手更自然地交互方式。
ReALM的一项关键创新是使用解析的屏幕上实体及其位置来重建屏幕的信息流逻辑,以生成捕获视觉布局的文本内容。研究人员证明,这种方法与专门用于参考解析的微调语言模型相结合,该任务的执行效率理论上是优于GPT-4的。
苹果研究人员在论文中写道:“让用户能够对屏幕上看到的内容发出查询指令,是确保人工智能语音助手真正实现免提交互体验的关键一步。”
今天,阿里云宣布为AI智能编程助手「通义灵码」分配了一个正式的员工工号:AI001。同时,阿里云正在内部全面推行AI编程,使用通义灵码辅助程序员写代码、读代码、查BUG、优化代码等。
阿里云专门阿里云相关人士透露:“公司未来将有20%的代码将由「通义灵码」AI程序员进行编写,但人类程序员仍然是研发的核心,他们将有更多时间专注于系统设计以及核心业务开发工作。”
当地时间4月1日,据The Information报道,根据新递交的证券备案文件,OpenAI CEO奥特曼已经不再具有OpenAI风险投资部门(OpenAI Startup Fund)旗下的投资基金的控制资格。
伊恩·海瑟薇(Ian Hathaway)自2021年起担任该基金的投资项目合伙人,目前是唯一被列为OpenAI风投基金的普通合伙人和基金经理的个人。此举意在将奥特曼对公司的控制权进一步剥离,避免陷入OpenAI独揽大权的局面。
当地时间4月1日,据《华尔街日报》报道,有业内人士分析,目前公开的互联网上,已有信息对于各大AI大模型研究公司进行大模型的训练已经不够用,他们正在寻找未开发的信息源,并重新思考如何训练这些系统。
据知情人士透露,为了训练更强大的多模态大模型,OpenAI内部已经在讨论已经讨论了根据YouTube公共视频的转录来训练其下一代模型GPT-5,并且正在尝试使AI生成的或合成的数据作为训练材料。
4月2日,昆仑万维旗下首个AI音乐生成大模型——天工SkyMusic,目前正在面向社会音乐人进行广泛地免费邀测。这是国内首个基于音乐作品生成的AI大模型,并且是免费提供。该公司计划在4月17日的「天工3.0」发布会上正式对外公布。
天工SkyMusic基于昆仑万维天工3.0超级大模型打造,可以生成80秒44100Hz采样率双声道立体声AI歌曲,并可根据用户输入的歌词风格生成对应歌曲风格;实现AI人声合成;通过歌词控制歌曲,体现出主歌和副歌、前奏和主歌的段落差异;支持说唱、民谣、放克、古风、电子等多种音乐风格。
昆仑万维SkyMusic本轮邀测将开放1000个免费名额,天工SkyMusic正式版将在4月17日随「天工大模型3.0」面向全社会免费开放。
热门榜单
通义万相
常用AI剪映
常用AIEmo-阿里巴巴的AI视频生成框架
常用AICanva AI图像生成
常用AI万相营造
常用AIARC
常用AIDeepSwapper
常用AIGraviti Diffus
常用AI悠船
常用AI热门资讯
B端设计教学_怎么进行UI视觉设计_B端设计教学
01-16阿里云发布通义千问2.5大模型:号称多项能力赶超GPT-4,发布开源模型Qwen1.5-110B
04-09中文多模态大模型SuperCLUE-V榜单发布丨Stability AI推出Stable Fast 3D模型丨Meta AI向好莱坞明星采买声音授权
02-11全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
04-15商汤全新AI绘图大模型“秒画Artist”v0.3.5版本上手测评:作画水平比肩Midjourney!划重点——免费
12-31stable diffusion初识_stable diffusion跟其他工具有什么区别]
01-17小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
02-24OpenAI今夜发布新版GPT-4大模型:“青春版”GPT4-Lite现身,AI搜索引擎「SearchGPT」代码首曝光
04-03谷歌Gemini引发争议!网友质疑宣传片疑似剪辑效果 夸大宣传丨实测对标GPT-4测评基准有失偏颇
12-30ChatGPT如何工作_ChatGPT如何进行多轮对话
01-26