谷歌发布AI视频生成模型Lumiere
谷歌1月23日在预印本平台arXiv发布文本到视频扩散模型Lumiere。Lumiere可以基于用户的自然语言提示、图像+提示生成长达5秒的视频,或者根据用户上传的单个参考图像,生成基于提示词的同风格视频,还允许用户通过自然语言指令生成一致的视频风格。用户可以指定特定区域使Lumiere对图像内容进行动画处理。
论文地址:https://arxiv.org/abs/2401.12945
Pika联手北大斯坦福开源文生图框架
Pika在社交平台X上宣布,Pika实验室与北京大学和斯坦福大学推出开源最新文本到图像生成、编辑框架RPG-DiffusionMaster,RPG在上下文理解、组合语义对齐、多轮对话理解等方面有显著改进。
地址:https://github.com/YangLing0818/RPG-DiffusionMaster
谷歌浏览器新增3项生成式AI功能
谷歌1月24日宣布为谷歌浏览器新增3项生成式AI功能,包括自动建议用户打开的选项卡并创建选项卡组、使用AI创建个性化浏览器主题、帮助用户起草餐厅评论等内容。
OpenAI 19人出走创业,融资总额近80亿美元
据Business Inside 1月22日报道,从OpenAI出走的19位科学家,已经纷纷创办初创公司,融资总金额高达80亿美元。包括OpenAI创始人之一马特·克里西洛G(Matt KrisiloG)、前运营主管杰夫·阿诺德(Jeff Arnold)等。Andreessen Horowitz、红杉资本、Index Ventures、Khosla Ventures和Y Combinator等顶级风险投资公司,OpenAI CEO萨姆·阿尔特曼(Sam Altman)、格雷格·布罗克曼(Greg Brockman)本人都支持了“十九子”的初创公司。
Meta纽约大学联手发布机器人框架OK-Robot
Meta和纽约大学联合发布新型开放知识型机器人框架OK-Robot,该框架不需要预训练,就可以在真实家庭环境中运行。经过测试,在10个真实的家庭环境中运行,OK-Robot拾取和放置任务的成功率达到58.5%,如果是干净整洁的环境成功率可以提升到82%。项目地址:https://ok-robot.github.io
论文:https://arxiv.org/abs/2401.12202
Artisse AI融资670万美元
AI摄影应用Artisse宣布成功融资670万美元,该公司专注于提升其AI生成照片的逼真度。与其他市场上的竞争对手一样,用户通过上传自己的照片,训练Artisse的AI模型,然后使用文本或图像提示生成各种不同场景、姿势和风格的新照片。
蚂蚁集团成立 AI 创新研发与应用部门 NextEvo
据 36 氪今日报道,蚂蚁集团已在内部成立了 AI 创新研发与应用部门,名为“NextEvo”,由蚂蚁集团副总裁徐鹏担任负责人。报道称,徐鹏曾在谷歌工作 11 年,负责和领导了谷歌翻译的核心技术研发,并参与了谷歌显示广告系统的算法研发。NextEvo 是蚂蚁内部的 AI“精锐部门”,据称其承担了蚂蚁 AI 的所有核心技术研发,包括蚂蚁百灵大模型的所有研发工作。
AIBetas整理的AI排行榜第一版已经正式上线,了解最新的AI产品及排行榜!
暂无评论内容