File tree Expand file tree Collapse file tree 2 files changed +27
-2
lines changed
Expand file tree Collapse file tree 2 files changed +27
-2
lines changed Original file line number Diff line number Diff line change @@ -172,9 +172,9 @@ Qwen3-235B-A22B、Qwen3-235B-A22B-nothink、Qwen3-30B-A3B、Qwen3-30B-A3B-nothin
172172
173173# 大模型基本信息
174174- [ 每周最新模型] ( 每周最新模型.md )
175+ - [ 8月18~ 8月24] ( 每周最新模型.md#8月188月24 )
175176 - [ 8月11~ 8月17] ( 每周最新模型.md#8月118月17 )
176177 - [ 8月4~ 8月10] ( 每周最新模型.md#8月48月10 )
177- - [ 7月28~ 8月3] ( 每周最新模型.md#7月288月3 )
178178- 更多信息详见[ 模型列表] ( https://nonelinear.com/static/models.html )
179179<br ><br >
180180
Original file line number Diff line number Diff line change 11## 目录
2+ - [ 8月18~ 8月24] ( #8月188月24 )
23- [ 8月11~ 8月17] ( #8月118月17 )
34- [ 8月4~ 8月10] ( #8月48月10 )
45- [ 7月28~ 8月3] ( #7月288月3 )
1213- [ 6月2~ 6月8] ( #6月26月8 )
1314<br ><br >
1415
16+ ## 8月18~ 8月24
17+ ### 8月22日
18+ - 【闭源】 阿里发布qwen-mt-image通义千问图像翻译模型,支持将11种语言图片的文字翻译成中文或英文,能精准保留原始排版与内容信息,并提供术语定义、敏感词过滤、图像主体检测等功能。详情请参见https://help.aliyun.com/zh/model-studio/qwen-mt-image-api
19+ - 【闭源】 阿里发布qwen-deep-research通义千问深入研究模型,它可以拆解复杂问题、结合互联网搜索进行推理分析并生成研究报告。详情请见https://help.aliyun.com/zh/model-studio/qwen-deep-research
20+ - 【闭源】 阿里发布fun-asr语音识别模型(稳定版和快照版),FunASR是通义实验室推出的端到端语音识别大模型,具备卓越的上下文感知和高精度转写能力,支持中英文录音文件识别。详情请参见https://help.aliyun.com/zh/model-studio/recording-file-recognition
21+
22+ ### 8月21日
23+ - 【开源】 DeepSeek发布DeepSeek-V3.1后训练模型,在DeepSeek-V3.1-Base基础上进行后训练优化,其基座 checkpoint 通过两阶段长上下文扩展方法构建。详情请参见https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
24+ - 【开源】 字节跳动Seed团队发布Seed-OSS系列开源大型语言模型,使用12T token训练,提供强大的长上下文、推理、代理和通用功能。包含三个版本:
25+ - Seed-OSS-36B-Base(含合成数据):https://modelscope.cn/models/ByteDance-Seed/Seed-OSS-36B-Base
26+ - Seed-OSS-36B-Base-woSyn(不含合成数据):https://modelscope.cn/models/ByteDance-Seed/Seed-OSS-36B-Base-woSyn
27+ - Seed-OSS-36B-Instruct:https://modelscope.cn/models/ByteDance-Seed/Seed-OSS-36B-Instruct
28+
29+ ### 8月20日
30+ - 【闭源】 阿里发布qwen-tts-vc-realtime-2025-08-20语音合成模型,qwen-tts-realtime模型的2025年8月20日快照版本,支持声音复刻与多语种语音合成。详情请参见https://help.aliyun.com/zh/model-studio/qwen-tts-realtime
31+ - 【开源】 DeepSeek发布DeepSeek-V3.1-Base基础模型,支持思考模式和非思考模式的混合模型。详情请参见https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
32+
33+ ### 8月19日
34+ - 【开源】 阿里发布Qwen-Image-Edit通义千问图像编辑模型,基于20B的Qwen-Image模型进一步训练,支持语义/外观双重编辑和精准的中英双语文字编辑,在多个公开基准测试中均获得SOTA性能。详情请参见https://www.modelscope.cn/models/Qwen/Qwen-Image-Edit
35+
36+ ### 8月18日
37+ - 【闭源】谷歌正式发布网址上下文工具,该工具可提供网址作为提示的额外上下文。对将网址上下文与gemini-2.0-flash模型搭配使用的支持将在1个月后停止。详情请参见https://ai.google.dev/gemini-api/docs/url-context?hl=zh-cn
38+ <br ><br >
39+
40+
1541## 8月11~ 8月17
1642### 8月15日
1743- 【开源】 腾讯发布Hunyuan-GameCraft 1.0,用于游戏环境高动态交互视频生成的新颖框架。将键盘鼠标输入统一到共享摄像机表示空间,采用混合历史条件训练策略,在超过100个AAA游戏的百万级游戏录制数据集上进行训练。详情请参见https://modelscope.cn/models/Tencent-Hunyuan/Hunyuan-GameCraft-1.0/summary
3056### 8月11日
3157- 【闭源】 阿里发布wan2.2-i2v-flash万相2.2极速版模型,相较2.1模型在画面细节表现和运动稳定性方面均有显著提升,生成速度提升达50%。详情请参见 https://help.aliyun.com/zh/model-studio/image-to-video-api-reference/
3258- 【开源】 智谱AI发布GLM-4.5V视觉语言模型,基于GLM-4.5-Air(106B参数,12B激活),在42个公开视觉多模态榜单中达到同级开源模型SOTA性能,支持图像推理、视频理解、GUI任务及思考模式开关。详情请参见https://modelscope.cn/models/ZhipuAI/GLM-4.5V/summary
33-
3459<br ><br >
3560
3661
You can’t perform that action at this time.
0 commit comments