当前位置:首页 » 《休闲阅读》 » 正文

20240408 每日AI必读资讯

29 人参与  2024年04月13日 13:01  分类 : 《休闲阅读》  评论

点击全文阅读


? 第一个具有情商的对话型AI来了!AI下一个重大飞跃是理解情感
- HumeAI发布具有情感识别能力的对话AI,能检测53种情绪。
- HumeAI致力于理解和回应用户情感,通过声音特征实现互动。
- 提供API让用户训练自己的AI模型,应用广泛覆盖健康、客服等领域。
?官网地址:https://dev.hume.ai/docs/expression-measurement-api/overview

? Lixel CyberColor:自动生成无限大的电影级效果的3D场景
- LCC采用Multi-SLAM和高斯溅射技术生成电影级效果的3D场景。
- XGRIDS的Multi-SLAM算法和3DGS技术创造逼真大型3D模型。
- XGRIDS提供LCC插件和SDK支持在多平台上无限复制3D内容。
?官网地址:https://xgrids.com/lcc
? https://blink.csdn.net/details/1676446

? OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4!
- OpenAI使用YouTube视频转录训练GPT-4。
- AI公司遇到高质量训练数据挑战。
- 公司处理数据问题涉及版权法模糊区域。
? https://blink.csdn.net/details/1676441

?Twitter-web-exporter:一键导出推文、书签、列表
- 可以直接从推特的网页版应用中导出推文、书签、关注列表等多种数据。
- 无需开发者账号和使用API密钥。
- 支持导出为 JSON、CSV 和 HTML。
? https://github.com/prinsss/twitter-web-exporter
? https://blink.csdn.net/details/1676450

?DeepMind发布Gecko: 专注于文档检索 性能媲美大7倍模型​​​​​​​
- Gecko是通用文本嵌入模型,专注于文档检索、语义相似度和分类任务。
- Gecko通过从LLM中提炼知识,融入检索器,实现强大检索性能。
- 在大规模文本嵌入基准上,256维Gecko优于768维现有模型。
?论文地址:https://arxiv.org/pdf/2403.20327.pdf

图片

?AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!
- MiniGPT4-Video框架能理解复杂视频,还能创作诗歌配文。
- 支持处理时态视觉数据和文本数据,善于理解视频的复杂性。
- 在多个基准测试中,MiniGPT4-Video有显着提高,可为视频配文、广告等提供强大解读能力。
?论文:https://arxiv.org/pdf/2404.03413.pdf

图片


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/94747.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1