- 奇绩大模型日报(7月 13-14日)
- 资讯
- OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
- OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服
- 英伟达又赚到了!FlashAttention3来了:H100利用率飙升至75%
- 豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性
- OpenAI 首位投资人 Vinod Khosla 最新福布斯对谈:中美技术经济战,赢得 AI 将会拥有巨大经济影响力
- 布局 IPU!继 Arm 翻盘之后,软银孙正义又收购一家英国 AI 芯片公司 Graphcore
- 推特
- CAMELAI分享引入了一个知识图谱代理:从处理过的内容中提取实体之间的关系,更高效地结构化数据
- supervision再更新:用于面部和身体姿势关键点的默认可视化工具
- Margaritelli分享:Llama3 8B在异构家庭集群上运行
- Werbei分享:对少数 AI 研究人员显而易见但大多数人不愿相信的事情
- RunwayML分享Gen-3 Alpha多个Demo:可以模拟水、油漆、油、蜂蜜和熔融玻璃等液体
- 产品
- Inrō
- Vocabuo
- HuggingFace&Github
- Motion-I2V
- Crawlee-python
- 投融资
- 2024年美国AI初创公司融资动态
- Aidatify完成830万美元融资
- 学习
- 大视觉模型 (LVM) 解读 (六):VIM:使用 ViT 改进的 VQGAN 进行矢量量化图像生成
- 蚂蚁集团在大模型推荐上的算法和应用
- 一周AI入门到设计一款NPU芯片系列一 给芯片设计爱好者的礼物
- A Primer on Memory Consistency and Cache Coherence 翻译计划(一):引言
- Ascend C 多核并行/流水计算/dobule buffer技术
- 重温SSM(四):有理生成函数的新视角
- 浅谈寒武纪开源的Triton-Linalg编译器前端
- 声明
奇绩大模型日报(7月 13-14日)
奇绩大模型日报(7月 13-14日)
2024年7月14日修改
资讯
OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
OpenAI最新绝密项目曝光!知情人士透露,OpenAI正在开发一个名为“草莓(Strawberry)”的新模型,它的前身是Q*。其工作机制在内部被严格保密,且细节从未被外界报道过。消息称,“草莓”模型不仅在超大规模数据集上完成预训练,并且采用了一种特殊的方法。
附件不支持打印
加载失败,
OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服