AI早报:Midjourney v6下周将补齐缩放平移及视频生成等功能;谷歌计划直接在 Bard 中添加 AI 图像生成器

AI早报:Midjourney v6下周将补齐缩放平移及视频生成等功能;谷歌计划直接在 Bard 中添加 AI 图像生成器

Midjourney v6下周将补齐缩放平移及视频生成等功能

Midjourney office time最新信息显示,在下周即将推出的 v6版本中,将引入一些新功能,包括缩放、平移和改变区域的能力,这是 v5版本中所不具备的。风格一致性也将在这个版本中率先推出,用户将能够复制风格,这无疑是一个令人兴奋的功能。而本次发行版本 beta 将转移到 alpha 版本,更精细的调整模型将成为亮点。

浙大团队推SIFU模型:单张图像准确重建高质量3D人体模型

浙江大学ReLER实验室的研究人员提出了一种名为SIFU的模型,该模型能够从单张图像准确重建3D人体模型,从而显著降低了成本并简化了独立创作的过程。SIFU模型引入了侧视图条件隐函数,通过在2D特征转换到3D空间时加入人体侧视图作为先验条件,增强了几何重建效果。此外,在纹理预测的阶段,模型还引入了预训练的扩散模型,以解决不可见区域纹理预测较差的问题。论文地址:https://arxiv.org/abs/2312.06704

项目代码:https://github.com/River-Zhang/SIFU

联想 AI 助手“小乐同学”3 个月后上线,支持自然语言交互

1月17日举行的联想拯救者及消费生态新品发布会上,联想公布了全新 AI 助手 —— 小乐同学。据介绍,联想的 AI 大模型战略采用端侧 + 云端混合式的 AI 大模型,除了 AI PC ,未来还将带来 AI 手机、AI 平板以及 AIoT。联想将全新 AI 语音助手命名为“小乐同学”,支持“伴随态自然语言交互 UI”,可一键唤醒、翻译文档、制作 PPT 等,预计三个月后推出正式版。

谷歌推数学几何模型Alpha Geometry

谷歌 DeepMind 近日在《Nature》上发表论文,展示了最新 AI 系统 AlphaGeometry,解决数学几何问题的能力媲美全球顶尖学生。AlphaGeometry 在高中生国际数学奥林匹克竞赛(IMO)中,30 道题目中正确回答 25 道,正确率为 83%。

论文地址:https://www.nature.com/articles/s41586-023-06747-5

项目代码:https://github.com/google-deepmind/alphageometry

谷歌美国推出AI多重搜索:图文同搜 提升用户体验

谷歌在美国发布了一项全新的人工智能功能,该功能允许用户在使用手机进行搜索时,能够同时搜索图片和文字信息。据悉,这项新功能运用了先进的人工智能技术,旨在提供更全面、更准确的搜索结果。用户在进行搜索时,系统将同时分析图片和文字信息,从而返回与用户需求更为匹配的搜索结果。

Runway更新Multi-Motion Brush运动笔刷功能

Runway更新了Multi-MotionBrush运动笔刷功能,可同时控制5个物体运动路径, 提供更多创作可能性,灵活控制图像动态效果。

谷歌计划直接在 Bard 中添加 AI 图像生成器

在搜索生成体验(SGE)和幻灯片之后,Google Bard 即将推出自家的图像生成器,为用户提供更广泛的创意空间。根据未发布的 Google Bard 变更日志(日期为1月18日)显示,用户可以通过Bard轻松地创作出令人惊艳的图像。与其他工具一样,Bard 提供了一个简便的创作过程,用户只需输入几个单词即可将他们的想象力变为现实。这一功能将由 Google 的 Imagen 系列模型提供支持,为用户提供高质量、逼真、高分辨率、美观的图像。在去年12月,Google 推出了 Imagen2,旨在显著提高图像质量,特别适用于企业用例,如徽标生成或创建带有文本叠加的图像。

三星发布AI手机Galaxy S24,可同声翻译和智能搜索

三星公司在最新召开的Galaxy Unpacked发布会上,正式发布了Galaxy S24系列手机,将具备外语通话同声翻译等多种人工智能功能。这款新手机将有两种不同语言的实时通话双向语音翻译,该公司表示,Galaxy S24系列是有史以来第一款提供这种功能的智能手机。它还提供了一个“画圈搜索”(Circle to Search)功能。用户可以在安卓系统的手机上选择任何想搜索了解的内容,无需在App之间切换,用一个简单的手势,比如在内容上画圈、突出显示、涂抹划线,点击内容确认,就可在谷歌中进行搜索,获得相关信息。

AI图形设计工具Recraft完成1200万美元A轮融资

Recraft是一家AI图形设计生成技术开发商,除了能够生成这些“光栅图像”外,它还能生成矢量图像,这些图像具有无限可伸缩性,可用于专业的图形设计领域,不同于图像质量常受限制的平台。Recraft已完成由硅谷Khosla Ventures领投的1200万美元A轮融资,前GitHub首席执行官Nat Friedman也参与了投资。其他投资方包括RTP Global、Abstract VC、Basis Set Ventures、Elad Gil以及其他一些天使投资者。


AIBetas整理的AI排行榜第一版已经正式上线,了解最新的AI产品及排行榜!

AI榜单:ai.aibetas.com.cn

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情

    暂无评论内容