加载失败,
- 奇绩大模型日报(4月 9日)
- 特别活动
- 推特
- 微软人工智能将在伦敦市中心开设一个新的人工智能中心
- Stable LM 2 - 12B:多语言模型, 性能与 Mixtral 相当
- Morph:完全开源的 AI 驱动的答案引擎,具有生成式用户界面
- NanoLLaVA:您口袋里的强大的 1B 视觉语言模型
- 语言模型为什么会在搜索方面存在困难?Kanishk Gandhi谈语言模型的数据问题
- 哪些RAG表现最好?ARAGOG:对高级RAG技术最全面的评估调查之一分析:HyDE和LLM重新排序可以提高检索精度
- 资讯
- Meta 下周发布 Llama3 两个版本!
- 不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局
- 纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
- Nat. Mach. Intell.|设计超高效疫苗,普林斯顿团队开发首个解码mRNA序列大模型
- 北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计
- 联发科推出生成式 AI 服务平台“达哥”,支持“最强繁体中文大模型”MR BreeXe
- 杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人
- CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
- 论文
- 密集训练,稀疏推断:重新思考混合专家语言模型的训练
- 语言模型的物理学:第3.3部分,知识容量缩放定律
- MIMIR:领域专家个性化智能体调优的简化平台
- 使用合成数据进行训练有多糟糕?语言模型崩溃的统计分析
- 探索与理解DPO限制的理论视角
- SqueezeAttention: 通过分层最优预算在LLM推理中管理KV缓存的二维方式
- 一个大规模的μ-转移的探索
- nanoLM: 通过准确损失预测跨尺度预训练LM的可负担性基准
- Diffusion-RWKV:为扩散模型扩展RWKV类架构
奇绩大模型日报(4月 9日)
奇绩大模型日报(4月 9日)
2024年4月10日修改
特别活动
附件不支持打印
加载失败,