update每周最新模型

jeinlee1991 · jeinlee1991 · commit 3fcb4eb33eb9 · 2025-08-20T12:18:45.000+08:00
diff --git a/README.md b/README.md
@@ -54,8 +54,8 @@
 - [2025/8/15] v4.11版本
   - “多模态·小学学科”新增3个评测集：PrimarySchoolChinese（图形题）、PrimarySchoolMathematics（图形题）、PrimarySchoolScience（图形题），详见[多模态评测](README-多模态评测.md)
   - “多模态·高中学科”新增4个评测集：HighSchoolBiology（图形题）、HighSchoolChemistry（图形题）、HighSchoolMathematics（图形题）、HighSchoolPhysics（图形题），详见[多模态评测](README-多模态评测.md)
-  - “多模态·初中学科”新增8个评测集：'MiddleSchoolBiology（图形题）', 'MiddleSchoolChemistry（图形题）', 'MiddleSchoolChinese（图形题）', 'MiddleSchoolPolitics（图形题）',
-    'MiddleSchoolGeography（图形题）', 'MiddleSchoolHistory（图形题）', 'MiddleSchoolMathematics（图形题）', 'MiddleSchoolPhysics（图形题）'，详见[多模态评测](README-多模态评测.md)
+  - “多模态·初中学科”新增8个评测集：MiddleSchoolBiology（图形题）、MiddleSchoolChemistry（图形题）、MiddleSchoolChinese（图形题）、MiddleSchoolPolitics（图形题）、
+    MiddleSchoolGeography（图形题）、MiddleSchoolHistory（图形题）、MiddleSchoolMathematics（图形题）、MiddleSchoolPhysics（图形题），详见[多模态评测](README-多模态评测.md)
   - 删除陈旧的模型：hunyuan-turbos-20250604、gpt-4o-mini
 - [2025/8/10] v4.10版本
   - 多模态新增4个评测集：HighSchoolChinese（图形题）、HighSchoolGeography（图形题）、HighSchoolHistory（图形题）、HighSchoolPolitics（图形题），详见[多模态评测](README-多模态评测.md)
@@ -167,9 +167,9 @@
 
 # 大模型基本信息
 - [每周最新模型](每周最新模型.md)
+  - [8月11~8月17](每周最新模型.md#8月118月17)
+  - [8月4~8月10](每周最新模型.md#8月48月10)
   - [7月28~8月3](每周最新模型.md#7月288月3)
-  - [7月21~7月27](每周最新模型.md#7月217月27)
-  - [7月14~7月20](每周最新模型.md#7月147月20)
 - 更多信息详见[模型列表](https://nonelinear.com/static/models.html)
 <br><br>
 
diff --git a/每周最新模型.md b/每周最新模型.md
@@ -1,4 +1,6 @@
 ## 目录
+- [8月11~8月17](#8月118月17)
+- [8月4~8月10](#8月48月10)
 - [7月28~8月3](#7月288月3)
 - [7月21~7月27](#7月217月27)
 - [7月14~7月20](#7月147月20)
@@ -10,7 +12,52 @@
 - [6月2~6月8](#6月26月8)
 <br><br>
 
+## 8月11~8月17
+### 8月15日
+- 【开源】 腾讯发布Hunyuan-GameCraft 1.0，用于游戏环境高动态交互视频生成的新颖框架。将键盘鼠标输入统一到共享摄像机表示空间，采用混合历史条件训练策略，在超过100个AAA游戏的百万级游戏录制数据集上进行训练。详情请参见https://modelscope.cn/models/Tencent-Hunyuan/Hunyuan-GameCraft-1.0/summary
+
+### 8月14日
+- 【闭源】 谷歌正式发布Imagen 4系列模型（Ultra、标准版、快速版），支持2K分辨率生成。详情请参见https://ai.google.dev/gemini-api/docs/imagen?hl=zh-cn
+
+### 8月13日
+- 【闭源】 阿里发布qwen-vl-max-2025-08-13视觉理解模型，提升多语言处理和文本渲染能力。详情请参见 https://help.aliyun.com/zh/model-studio/vision/ 
+- 【开源】 Skywork AI发布Matrix-Game 2.0，首个开源实时长序列交互世界模型，支持25 FPS视频生成。详情请参见https://modelscope.cn/models/Skywork/Matrix-Game-2.0/summary
+
+### 8月12日
+- 【闭源】 Anthropic推出Claude Sonnet 4的100万令牌上下文窗口，增加5倍容量，支持处理超过75,000行代码。详情请参见https://docs.anthropic.com/en/docs/build-with-claude/context-windows#1m-token-context-window
+- 【开源】百川智能发布Baichuan-M2-32B医疗增强推理模型，基于Qwen2.5-32B构建，采用大型验证系统和多阶段强化学习策略，在HealthBench上超越所有开源模型并达到接近GPT-5的医疗能力。详情请见https://modelscope.cn/models/baichuan-inc/Baichuan-M2-32B/summary
+
+### 8月11日
+- 【闭源】 阿里发布wan2.2-i2v-flash万相2.2极速版模型，相较2.1模型在画面细节表现和运动稳定性方面均有显著提升，生成速度提升达50%。详情请参见 https://help.aliyun.com/zh/model-studio/image-to-video-api-reference/
+- 【开源】 智谱AI发布GLM-4.5V视觉语言模型，基于GLM-4.5-Air（106B参数，12B激活），在42个公开视觉多模态榜单中达到同级开源模型SOTA性能，支持图像推理、视频理解、GUI任务及思考模式开关。详情请参见https://modelscope.cn/models/ZhipuAI/GLM-4.5V/summary
+
+<br><br>
+
+
+## 8月4~8月10
+### 8月8日
+- 【闭源】搜索结果内容块现在已在 Anthropic API 和 Google Cloud 的 Vertex AI 上全面推出。此功能能够为具有适当来源归属的 RAG 应用实现自然引用。不再需要 2025 年 6 月 9 日的 beta 首头部 search-results-2025-06-09。更多内容请查看搜索结果文档https://docs.anthropic.com/en/docs/build-with-claude/search-results。
+
+### 8月7日
+- 【闭源】谷歌gemini图像转视频生成中的允许成人内容设置现在已在受限制地区提供。详情请参见 Veo 页面https://ai.google.dev/gemini-api/docs/video?example=dialogue#veo-model-parameters。
+- 【闭源】OpenAI发布新一代旗舰模型GPT-5（也包含mini/nano两款轻量模型），GPT-5也是所有已登录用户的新型默认模型。它简化了 ChatGPT，将其整合为一个自动切换的系统，将我们之前各模型的优势集于一身，成为一个智能且高效的新模型。所有 ChatGPT 计划的用户均可使用 GPT-5 。付费计划（Plus、Pro、Team）的用户可以使用模型选择器，能够手动选择 GPT-5 或 GPT-5 Thinking。Pro 和 Team 计划的用户可使用 GPT-5 Thinking Pro，虽然思考耗时稍长，但能为复杂任务提供所需的高精准度。了解更多关于 ChatGPT 中 GPT-5 的信息https://help.openai.com/en/articles/11909943。
+
+### 8月6日
+- 【闭源】MiniMax语音模型Speech 2.5发布，新一代语音生成模型，极致相似度，支持更多语种
+
+### 8月5日
+- 【开源】OpenAI 正式开源gpt-oss-120b / 20b 系列大模型，专为强大的推理、代理任务和多用途开发场景设计，单卡 H100 或 16 GB 内存可实现本地部署，支持可调推理深度、完整思维链、函数调用、网页浏览及 LoRA 微调，两款模型情况如下：gpt-oss-120b —— 适用于生产环境、通用目的和高推理需求的场景，可以装入单个 H100 GPU（117B 参数，其中 5.1B 激活参数）；gpt-oss-20b —— 适用于低延迟以及本地或特定用途的场景（21B 参数，其中 3.6B 激活参数）。模型链接：[gpt-oss-120b](https://modelscope.cn/models/openai-mirror/gpt-oss-120b)，[gpt-oss-20b](https://modelscope.cn/models/openai-mirror/gpt-oss-20b)
+- 【闭源】Anthropic推出了 Claude Opus 4.1，这是对 Claude Opus 4 的一次渐进式更新，具有增强的能力和性能改进。更多内容请查看模型和定价文档https://docs.anthropic.com/en/docs/about-claude/models。
+
+### 8月4日
+- 【开源|图像生成】通义千问团队开源了首个图像生成基础模型 Qwen-Image，一个20B的MMDiT模型，展示其在复杂文本渲染和精确图像编辑方面取得的显著进展，模型主要特性包括：卓越的文本渲染能力: Qwen-Image 在复杂文本渲染方面表现出色，支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文，均能实现高保真输出；一致性的图像编辑能力（即将推出）: 通过增强的多任务训练范式，Qwen-Image 在编辑过程中能出色地保持编辑的一致性；强大的跨基准性能表现: 在多个公开基准测试中的评估表明，Qwen-Image 在各类生成与编辑任务中均获得SOTA，是一个强大的图像生成基础模型。目前魔搭社区AIGC专区已支持Qwen-Image的在线推理、训练。模型链接：https://www.modelscope.cn/models/Qwen/Qwen-Image。
+<br><br>
+
+
 ## 7月28~8月3
+### 8月1日
+- 【闭源】Kimi K2 高速版模型 kimi-k2-turbo-preview 正式发布。（注：kimi-k2为开源，但kimi-k2-turbo没有对应的开源版本）
+
 ### 7月31日
 - 【开源】阶跃星辰发布step-3模型，该模型拥有强大的视觉感知和复杂推理能力，可准确完成领域的复杂知识理解、数学与现实信息的交叉分析，以及日常生活中的各类视觉分析问题。详情见https://platform.stepfun.com/docs/llm/reasoning。
 - 【闭源】谷歌发布Veo 3预览版模型，针对Veo 3预览版模型推出了图像转视频功能，并发布了Veo 3 Fast预览版模型，进一步提升生成效率。Veo 3详细请访问https://ai.google.dev/gemini-api/docs/video?hl=zh-cn&example=dialogue。
@@ -27,6 +74,8 @@
 - 【闭源】阿里发布wan2.2-t2v-plus文生视频模型，新版本在画面细节表现和运动稳定性方面均有显著提升，生成速度提升达50%。详细信息见https://help.aliyun.com/zh/model-studio/text-to-video-api-reference。
 - 【闭源】阿里发布wan2.2-t2i-flash、wan2.2-t2i-plus文生图模型，相较2.1模型，新版本在创意性、稳定性、写实质感上全面升级，生成速度提升达50%。详细请见https://help.aliyun.com/zh/model-studio/text-to-image-v2-api-reference。
 - 【开源】智谱发布GLM-4.5系列模型，GLM-4.5拥有3550亿总参数和320亿激活参数，GLM-4.5-Air采用更紧凑设计，1060亿总参数和120亿激活参数。两个模型都是混合推理模型，提供复杂推理和工具使用的思维模式，以及即时响应的非思维模式。模型的相关详细介绍请见：https://docs.z.ai/guides/llm/glm-4.5
+<br><br>
+
 
 ## 7月21~7月27
 ### 7月27日