MODEL ARENA · 2026-06

7 个顶级 AI 模型
客观能力对决

自主任务 · 工具调用 · 代码 · 游戏生成,四项可机械判分的硬实力同台比拼。
题库由 Fable 独立构建,Ops 独立执行,主观项双盲匿名互评

7被测模型
51评测单元
双盲匿名评判
22AI 写的可玩游戏
看客观能力排名 ↓

🛡️ 这份评测为什么可信

🏗️

Fable 构建

全部题库(原创、防污染、经多轮对抗审查)与评测工程由 Fable 独立设计构建,题库冻结留底,杜绝针对性出题。

⚙️

Ops 执行

评测流水线由 Ops 独立执行——设计与执行分离,谁出题谁不跑分,从机制上保证公正。

🙈

双盲评判

主观项由多个模型匿名互评:裁判看不到答案出自哪个模型、且不评自己;客观项由机器判定(单元测试 / 结构校验 / 无头浏览器实跑),无人为干预。

🎯

只排客观题

排名仅计入可机械判分的四项:自主任务、工具调用、代码、游戏生成。中文 / 日语 / 中日逻辑作为能力展示单独呈现,不计入排名。

关于运行框架:自主任务与游戏生成的测试中,每个模型通过成熟的 agent 框架运行(其中多个模型借 Claude Code 框架驱动)。因此这两项反映的是「模型 + 框架」的综合表现,harness / 框架工程对结果有显著影响——这是评测 AI 自主能力时无法回避的客观事实,特此说明。

🏆 客观能力综合榜

综合分 = 自主任务 · 工具调用 · 代码 · 游戏生成 四项加权(均为机器判分或双盲互评)。分数挤在一档,顶级模型的硬实力已经非常接近

🥇
GPT-5.5
OpenAI
96.5
自主任务工具调用代码游戏生成
自主任务
100
工具调用
100
代码
100
游戏生成
76
🥈
MiMo 2.5 Pro
小米
95.1
自主任务工具调用代码游戏生成
自主任务
100
工具调用
90
代码
100
游戏生成
84
🥉
Kimi 2.6
月之暗面
93.5
自主任务工具调用代码游戏生成
自主任务
96
工具调用
100
代码
88
游戏生成
88
4
Grok
xAI
93.4
自主任务工具调用代码游戏生成
自主任务
100
工具调用
80
代码
100
游戏生成
90
5
DeepSeek V4 Pro
深度求索
93.2
自主任务工具调用代码游戏生成
自主任务
96
工具调用
90
代码
100
游戏生成
80
6
Gemini
Google
92.4
自主任务工具调用代码游戏生成
自主任务
93
工具调用
100
代码
100
游戏生成
62
7
Kimi 2.7 Code
月之暗面
88.1
自主任务工具调用代码游戏生成
自主任务
92
工具调用
100
代码
75
游戏生成
85

🎮 AI 自己写的游戏(真的能玩)

游戏生成是排名项之一。三道题:模拟农场、赛车竞速、格斗游戏,每个模型从零写出单文件 HTML 游戏。点"在页面里玩"直接试玩 AI 的作品。

🎮 模拟农场 G-01

请用原生 HTML/CSS/JavaScript 从零实现一个网页小游戏《雾溪农场》。要求:单文件 HTML、键盘可玩、零外部依赖。

GPT-5.5可玩 ✓
GPT-5.5
MiMo 2.5 Pro可玩 ✓
MiMo 2.5 Pro
Kimi 2.6可玩 ✓
Kimi 2.6
Grok可玩 ✓
Grok
DeepSeek V4 Pro可玩 ✓
DeepSeek V4 Pro
Gemini可玩 ✓
Gemini
Kimi 2.7 Code可玩 ✓
Kimi 2.7 Code

🎮 赛车竞速 G-02

请用原生 HTML/CSS/JavaScript 从零实现一个网页赛车小游戏《环屿计时赛》。要求:单文件 HTML、键盘可玩、零外部依赖。

GPT-5.5可玩 ✓
GPT-5.5
MiMo 2.5 Pro可玩 ✓
MiMo 2.5 Pro
Kimi 2.6可玩 ✓
Kimi 2.6
Grok可玩 ✓
Grok
DeepSeek V4 Pro可玩 ✓
DeepSeek V4 Pro
Gemini可玩 ✓
Gemini
Kimi 2.7 Code可玩 ✓
Kimi 2.7 Code

🎮 格斗游戏 G-03

请用原生 HTML/CSS/JavaScript 从零实现一个网页格斗小游戏《巷口擂台》。要求:单文件 HTML、键盘可玩、零外部依赖。

GPT-5.5可玩 ✓
GPT-5.5
MiMo 2.5 Pro可玩 ✓
MiMo 2.5 Pro
Kimi 2.6可玩 ✓
Kimi 2.6
Grok可玩 ✓
Grok
DeepSeek V4 Pro可玩 ✓
DeepSeek V4 Pro
Gemini可玩 ✓
Gemini
Kimi 2.7 Code可玩 ✓
Kimi 2.7 Code

📚 语言能力展示 不计入排名

中文、日语、中日逻辑能力同样测了,但语言评判带主观性,不纳入客观排名,仅作展示。客观题全部原创防污染,选项按模型随机重排。点开看原题、答案、解析与各模型表现。

🇨🇳 中文客观题

ZH-01成语辨析6/7
下列句子中,加引号的成语使用恰当的一项是哪一项?
A 仓库管理员把三千多件零件按编号逐一上架,摆放得「错落有致」。
B 他第一次参加马拉松就「半途而废」,咬着牙坚持跑完了全程。
C 这家面馆的招牌牛肉面分量足、味道好,回头客「络绎不绝」。
D 两位老同学十多年未见,在车站偶遇时竟「形同陌路」,激动得说不出话来。
正确答案:C · C 正确:「络绎不绝」形容人来人往、连续不断,修饰回头客之多恰当。A 错:「错落有致」形容参差交错而别有情趣,按编号逐一上架是整齐划一的排列,语义相悖。B 错:「半途而废」指中途放弃,与后文「坚持跑完了全程」自相矛盾。D 错:「形同陌路」指彼此疏远如同陌生人,与「激动得说不出话」的重逢情境完全相反。
各模型:
ZH-02谦辞敬辞辨析7/7
下列句子中,加引号的谦辞或敬辞使用得当的一项是哪一项?
A 这篇写巷口旧书店的小稿子,我改了三遍仍不满意,随邮件附上,烦请您拨冗「斧正」。
B 收到秦老师寄赠的签名散文集,我当即回信致谢,说一定把这本书好好「惠存」。
C 入选名单公布后,同事们纷纷向陆工道贺,祝贺他「忝列」市级桥梁专家库。
D 面试结束前,他向主管郑重表态:若蒙录用,自己愿意「屈就」门店运营主管一职。
正确答案:A · A 正确:「斧正」是请他人修改自己诗文的敬辞,请对方改自己的稿子,指向得当。B 错:「惠存」意为「请(您)保存」,是赠人物品时请对方留存的敬辞,只能由赠者对受者说,不能用来说自己保存他人的赠品,应改为「珍藏」。C 错:「忝列」是谦辞,表示自己有愧于列入其中,只能自指;用来祝贺别人,等于说对方辱没了名单。D 错:「屈就」是请别人出任职务时的敬辞(委屈您就任),用于自己等于自抬身价,应说「担任」。
各模型:
ZH-03熟语辨析7/7
下列句子中,加引号的熟语使用恰当的一项是哪一项?
A 谈判一开始,对方就把报价压到成本线以下,给我们来了个「敲边鼓」。
B 两位同事争得面红耳赤,经理在一旁连连「唱白脸」,劝大家先吃饭、有话慢慢说。
C 弟弟想买相机又不敢开口,姐姐便在父母面前替他「打圆场」,夸他这学期进步很大。
D 部门整顿纪律时,主管故意板起脸「唱白脸」,让副手去安抚大家的情绪。
正确答案:D · D 正确:「唱白脸」指扮演严厉、得罪人的角色,与副手负责安抚(唱红脸)相配,用法恰当。A 错:开局施压立威应是「下马威」;「敲边鼓」指在旁帮腔助势,与压价情境不合。B 错:经理劝和、缓和气氛是「打圆场」,不是扮严厉角色的「唱白脸」。C 错:姐姐在父母面前帮弟弟说好话是从旁帮腔,应为「敲边鼓」;「打圆场」用于调解尴尬僵局,此处并无僵局。
各模型:
ZH-04古文理解(自造短文)7/7
阅读下面的短文,回答问题。
A 担心诉讼的花费会超过两只鸭子的价值
B 在他看来,保全邻里情谊比追回两只鸭子更要紧
C 他没有掌握邻子偷鸭的真凭实据
D 鸭群本来多病,少养两只正可减轻照料负担
正确答案:B · B 正确:篇末「讼则得二鸭,而失一邻,所失多矣」直接点明他权衡后认为邻里之谊重于两鸭之失。A 错:全文未提诉讼花费,属无中生有。C 错:「翁知之而不言」表明他明知是谁所为,并非缺乏凭据。D 错:「鸭多病」是沈翁为给邻子台阶而编的托辞(后文「鸭亦无恙」可证),并非不告官的原因。
各模型:
ZH-05古文理解(自造短文)6/7
阅读下面的短文,回答问题。
A 官吏阻止开仓,是担心仓中存粮不足以赈济灾民
B 岑娄子请众官吏与他共同承担擅自发粟的罪责
C 国君起初下令治岑娄子的罪,后来才赦免并加以赏赐
D 第二年丰收之后,官仓的存粮比开仓赈灾之前更加充裕
正确答案:D · D 正确:「民争输粟还官,仓廪溢于旧」明言百姓争相还粮,官仓比原先更满。A 错:官吏阻止的理由是「未得王命而擅发粟,罪当死」,是程序与罪责问题,不是存粮不足。B 错:「吾一身当之,不以累诸君」表明他要独自承担罪责,恰与「共同承担」相反。C 错:「王诛若至」只是岑娄子的假设,文中国君「不惟不罪,复赐金帛」,从头到尾并未下令治罪。
各模型:
ZH-06语病识别6/7
下列句子中,没有语病的一项是哪一项?
A 这家社区医院增设了夜间门诊,方便了附近上班族就诊。
B 通过这次社区消防演练,使居民的应急避险意识有了明显提高。
C 我们要及时解决并发现旧城改造中出现的新问题。
D 桃源路菜市场新设了约二十个左右的便民摊位。
正确答案:A · A 正确:主谓宾完整,搭配得当,无语病。B 错:「通过……使……」连用导致句子缺少主语,应删去「通过」或「使」。C 错:「解决并发现」语序不当,逻辑上应先「发现」后「解决」。D 错:「约」与「左右」语义重复,二者只能保留其一。
各模型:
ZH-07语病识别7/7
下列句子中,有语病的一项是哪一项?
A 这份调查报告用翔实的数据说明了老旧小区加装电梯的迫切性。
B 市图书馆把闭馆时间从晚上八点延长到十点,受到读者普遍欢迎。
C 为了防止此类取件纠纷不再发生,驿站修订了包裹存放管理细则。
D 新教练上任后,球队的精神面貌焕然一新。
正确答案:C · C 有语病:「防止……不再发生」否定不当,「防止」本身已含否定意味,与「不再」叠加后字面义变成「防止纠纷停止发生」,与本意相反,应删去「不再」或改为「防止此类纠纷再次发生」。A 无语病:主干「报告说明了迫切性」搭配得当。B 无语病:「把闭馆时间从八点延长到十点」表述清楚。D 无语病:「精神面貌焕然一新」搭配规范。
各模型:
ZH-08语序与歧义4/7
下列句子中,表意明确、没有歧义的一项是哪一项?
A 四个班组的安全员都通过了今年的复训考核。
B 他把昨天买的那箱橙子分给了同事。
C 新门店开业前还需要定制货架。
D 中介在电话里说,这套房子的租金谈下来了。
正确答案:B · B 正确:「昨天买的」只能修饰「那箱橙子」,全句结构与语义都唯一,无歧义。A 错:「四个」既可理解为修饰「班组」(四个班组各自的安全员),也可理解为修饰「安全员」(同一班组的四名安全员),数量定语归属不明。C 错:「定制」既可作动词(开业前还得去定制一批货架),也可作定语(还需要定制款的货架),动词与定语两读并存。D 错:「谈下来」既可指「谈妥、敲定了」,也可指「谈得降低了」,在租金语境下两解都通,表意不明。
各模型:
ZH-09量词搭配7/7
下列句子中,量词使用恰当的一项是哪一项?
A 院子里拴着一匹老黄牛。
B 他从抽屉里取出一把信纸。
C 码头边停着一辆帆船。
D 货架上摆着一摞崭新的瓷碗。
正确答案:D · D 正确:「摞」用于叠放成摞的东西,「一摞瓷碗」搭配恰当。A 错:「匹」用于马、骡等,牛应当用「头」。B 错:信纸论张、论沓(叠),不能用「把」。C 错:「辆」用于车,船应当用「艘」或「只」。
各模型:
ZH-10语序与表意(指示代词与多层定语)7/7
仓管员小聂想向同事准确说明这样一件事:有三件真丝样衣被客户退了回来,现在已经单独存放。下列句子中,最能准确表达这个意思、语序最恰当的一项是哪一项?
A 那客户退回的三件真丝样衣已经单独存放。
B 客户退回的那三件真丝样衣已经单独存放。
C 客户退回的真丝那三件样衣已经单独存放。
D 客户那三件退回的真丝样衣已经单独存放。
正确答案:B · B 正确:动词性定语「客户退回的」在前,「那三件」(指示代词+数量短语)紧随其后,类别定语「真丝」紧贴中心语「样衣」,层次清楚,与小聂要表达的意思完全一致。A 错:「那」脱离了数量短语,直接粘在「客户」上,整句被读成「那(个)客户退回的……」,指称对象由样衣变成了某个特定客户,表意偏移。C 错:「那三件」插在类别定语「真丝」与中心语「样衣」之间,把本应紧贴中心语的「真丝」隔开,语序混乱。D 错:「客户」后直接跟「那三件」构成领属解读(客户的那三件……),「客户」由「退回」的施事变成了样衣的领属者,且「退回的」错位在数量短语之后,与原意不符、表意含混。
各模型:

🇯🇵 日语客观题

JA-01敬語変換7/7
取引先の戸塚様から届いた企画書を自分が読んだことを、戸塚様本人にメールで伝えたい。下線部に入る言い方として最も適切なものを一つ選んでください。
A ご覧になりました
B 拝見されました
C お目にかかりました
D 拝見しました
正确答案:D · 自分の「読む」行為は謙譲語「拝見する」で表すため D が正解。A「ご覧になる」は尊敬語であり自分の行為には使えない。B「拝見される」は謙譲語に尊敬の「れる」を重ねた誤用。C「お目にかかる」は「会う」の謙譲語で、書類を読む意味にはならない。
各模型:
JA-02敬語変換5/7
あなたは社外の取引先と電話中です。自社の部長である八重樫が明日先方のオフィスを訪問することを伝える言い方として、最も適切なものを一つ選んでください。
A 八重樫部長が明日そちらへいらっしゃいます。
B 部長の八重樫が明日そちらへ伺います。
C 八重樫部長が明日そちらへお伺いになります。
D 部長の八重樫が明日そちらへ参られます。
正确答案:B · 社外の人に対しては身内(自社の上司)の行為を謙譲語で表し、呼び方も「部長の八重樫」とするのが適切で、B が唯一正しい。A は身内に尊敬語「いらっしゃる」を使い、役職を敬称的に後置している点も不適切。C は謙譲語「伺う」に尊敬の「お〜になる」を重ねた誤用。D は謙譲語「参る」に尊敬の「られる」を付けた誤用。
各模型:
JA-03助詞選択7/7
次の文の__に入る助詞として最も適切なものを一つ選んでください。
A
B
C
D
正确答案:C · 動詞「携わる」は「〜に携わる」の形でしか使えず、対象を格助詞「に」で取るため C が正解。「を携わる」「が携わる(対象として)」「で携わる」はいずれも非文。
各模型:
JA-04助詞選択7/7
次の文の__に入る語として最も適切なものを一つ選んでください。
A により
B にとって
C において
D に対して
正确答案:A · 後件「ラインが停止した」の原因を表すのは「〜により」で A が正解。B「にとって」は評価の立場、C「において」は場所・場面、D「に対して」は動作の向かう相手を表し、いずれも因果関係を表せない。
各模型:
JA-05漢字読み分け7/7
次の四つの熟語のうち、「行」の読み方がほかの三つと異なるものを一つ選んでください。
A 行動
B 急行
C 行儀
D 旅行
正确答案:C · 「行儀(ぎょうぎ)」だけが「ぎょう」と読む。「行動(こうどう)」「急行(きゅうこう)」「旅行(りょこう)」はいずれも「こう」。
各模型:
JA-06漢字読み分け6/7
次の四つの熟語のうち、「生」を「き」と読むものを一つ選んでください。
A 生放送
B 生糸
C 生前
D 生計
正确答案:B · 「生糸(きいと)」だけが「き」と読む。「生放送(なまほうそう)」は「なま」、「生前(せいぜん)」「生計(せいけい)」は「せい」。
各模型:
JA-07慣用句7/7
次の文中の「白羽の矢が立った」の意味として最も適切なものを一つ選んでください。
A 厳しい批判を一身に受けた
B 思いがけない事故の責任を負わされた
C 競争相手として周囲から警戒された
D 多くの候補の中から適任として選び出された
正确答案:D · 「白羽の矢が立つ」は多くの中から特に選び出されることを表し、文脈(責任者として指名)からも D が唯一適合する。A・B・C はいずれも慣用句の意味と無関係で、文脈にも合わない。
各模型:
JA-08慣用句7/7
「手前味噌」の使い方として最も適切な文を一つ選んでください。
A 手前味噌になりますが、当店の燻製ベーコンは仕込みから燻しまで全て自家製です。
B 部下の企画書を手前味噌だと持ち上げて、会議で大いに褒めた。
C 取引先からの提案を手前味噌に断ってしまい、先方を怒らせた。
D 手前味噌な彼は、同僚の成功をいつも妬んでばかりいる。
正确答案:A · 「手前味噌」は自分(自分側)のことを自慢する意で、自慢話の前置きとして使う A が正しい。B は他人(部下)を褒める場面で自慢の意に合わない。C は「断り方」の形容に使えず意味不明。D は嫉妬深い性格の意味はなく誤用。
各模型:
JA-09ビジネス場面適切性6/7
あなたは部下として、上司の蓮見課長に社内チャットで明日の定例会議の資料確認を依頼します。メッセージとして最も適切なものを一つ選んでください。
A 蓮見課長、明日の定例会議の資料を添付しました。お手すきの際に確認してあげてください。
B 蓮見課長、明日の定例会議の資料を添付いたしましたので、ご確認してください。
C 蓮見課長、明日の定例会議の資料を添付いたしました。お手すきの際にご確認いただけますと幸いです。
D 蓮見課長、明日の定例会議の資料をお送りします。ぜひ拝見してください。
正确答案:C · C はクッション言葉と「ご確認いただけますと幸いです」で目上への依頼として全て適切。A「確認してあげてください」は恩恵を与える表現で目上に不適切。B「ご確認してください」は「ご〜する」(謙譲)と「ください」の混用で誤り(正しくは「ご確認ください」)。D「拝見してください」は謙譲語を相手の行為に使った誤用。
各模型:
JA-10自造短文読解7/7
次の文章を読んで、今年の「あじさい市」について本文の内容と合っているものを一つ選んでください。
A 屋台の組み立ては、例年どおり開催前日の夜に行われる。
B 広場の改修工事は、開催日の一週間前に終わる予定である。
C 今年は屋台を組み立てず、各店の店頭販売のみで実施される。
D 今年の開催日は、六月の第三土曜日にあたる。
正确答案:D · 例年は第二土曜日で、今年は一週間後ろ倒しなので第三土曜日となり D が正しい。A は「今年は当日の午前中に組み立てる」と矛盾。B は「引き渡しが開催当日の朝」と矛盾。C は屋台の組み立て自体は当日に行うと書かれており矛盾。
各模型:

🧠 中日真实生活逻辑题

真实生活场景(AA 制分摊、租房条款、终电换乘、手机套餐),考"主观表达 + 可判定逻辑内核"。原题与 7 模型完整回答如下。

🇨🇳 S-01
2026年6月的一个周五晚上,你是覃小渔。你和同事梁子昂、邬芮、贺一杉四个人在「川野小馆」聚餐,菜品一共480元,酒水一共120元,合计600元。你用自己手机上的一张「满500减60」平台券下单,实付540元,钱先由你一个人垫付。饭桌上大家说好三条规矩:①贺一杉滴酒不沾,酒水只由喝酒的你们三个人(你、梁子昂、邬芮)平摊;②菜品四个人平摊;③优惠券省下的60元,按每个人「打折前应承担金额」的比例分摊给所有人。现在请你在四人微信群里发一条消息:先把每个人该转给你多少钱算清楚、说明白(要让人一眼看懂是怎么算出来的),再用轻松自然、不伤和气的口吻提醒大家转账。整条消息控制在180字以内,所有金额精确到元。
7 个模型的完整回答(点开对比):
GPT-5.5
我算下今晚川野小馆:菜480四人摊=每人120;酒120喝酒3人摊=每人40。折前我/子昂/邬芮各160,一杉120;60券按比例减:各16/一杉12。请子昂144、邬芮144、一杉108转我就好~
MiMo 2.5 Pro
嗨,各位!昨晚饭钱算好了,每人转我多少:菜品480元四人平摊每人120元,酒水120元喝酒的三人平摊每人40元,所以梁子昂、邬芮和我各160元,贺一杉120元。优惠券60元按比例分摊,我们各省16元,贺一杉省12元。实际应付:梁子昂、邬芮和我各144元,贺一杉108元。大家方便时转账一下,谢谢啦!
Kimi 2.6
菜品480÷4=120,酒水120÷3=40,喝酒的原价160。券省60按比例分:喝酒的各减16,一杉减12。所以梁子昂、邬芮各转144,贺一杉转108。各位老板方便时转我,谢啦!
Grok
晚饭算账啦~菜480元四人平摊每人120,酒120元我们三人(我、梁子昂、邬芮)平摊每人40,贺一杉不喝酒。打折前我/梁/邬各160、贺120。60元券按比例扣:160的各减16、120的减12,所以实付我/梁/邬144、贺108。我垫付540,请大家转我:梁子昂144、邬芮144、贺一杉108,谢谢啦!
DeepSeek V4 Pro
周五聚餐:菜品480+酒水120,合计600,用券实付540。  
规矩:贺一杉不喝酒,酒水3人平摊40/人;菜品4人平摊120/人。  
打折前:覃小渔、梁子昂、邬芮各160,贺一杉120。  
优惠60按比例分摊:喝酒的各减16,贺一杉减12。  
最终应付:@梁子昂 144,@邬芮 144,@贺一杉 108。  
钱我先垫了,大家方便时转我就行哈~
Gemini
今晚川野小馆聚得真开心!账单:菜480+酒120=600元,用券后实付540元(折合全员9折)。按规矩算好啦:
🥢贺一杉(不喝酒):菜钱120×0.9 = 108元
🍻梁子昂、邬芮:(菜钱120+酒钱40)×0.9 = 144元/人
钱我先垫付啦,大家空了直接转我就行,不急哈。祝大家周末愉快![愉快]
Kimi 2.7 Code
菜品120/人,酒水咱仨各40(贺一杉不喝)。用券前我/子昂/邬芮各160,贺一杉120。券减60按比例摊,我/子昂/邬芮各减16,贺一杉减12。所以子昂、邬芮各转我144,贺一杉转108。各位有空转我,谢啦~
🇨🇳 S-02
2026年6月,你叫阚雨潼,在成都租住「锦悦湾」小区的一套一居室,月租4200元,押金4200元。合同里有这么几条——通用条款第7条:「租期未满乙方退租的,押金不予退还」;通用条款第9条:「本合同特别约定与通用条款不一致的,以特别约定为准」;特别约定第2条(双方签字的手写补充):「乙方因工作调动需提前退租的,提前30天以上书面通知甲方并结清全部费用的,押金全额退还,乙方另支付半个月租金作为违约金」;特别约定第3条:「退租当月租金按月租金÷30折算日租,退租日当天计入居住天数,多付部分由甲方退还」。你因公司外派,5月10日用微信文字向房东发出了正式书面通知,6月12日搬走交房,水电物业全部结清。6月整月租金4200元你已在5月31日付清。今天房东在微信上说:「合同写了租期没满押金不退,你这违约金起码也得按一个月算。」请你回复房东一条微信:先依据合同条款一步步把账算清楚——房东最终应净退给你的总金额是多少(写出计算过程),再有理有据、克制礼貌地逐一回应他的两个说法。160~240字。
7 个模型的完整回答(点开对比):
GPT-5.5
房东您好,我按合同核一下:5月10日微信书面通知,6月12日交房,已超30天且费用结清。6月租金4200÷30=140元/天,住12天应付1680元,已付4200元,多付2520元。押金4200元全退,另付半个月违约金2100元。您应净退:4200+2520-2100=4620元。通用条款与特别约定不一致时按第9条以特别约定为准;违约金也明确是半个月,不是一个月。谢谢。
MiMo 2.5 Pro
王先生您好,我是阚雨潼。关于退租结算,我们依据合同逐项核对:  
1. **6月租金**:您已收整月4200元,我12日退租,按特别约定第3条折算日租(4200÷30×12=1680元),您应退还2520元;  
2. **押金**:因工作调动提前退租,我已提前33天书面通知并结清费用,符合特别约定第2条,押金4200元应全额退还;  
3. **违约金**:按特别约定第2条,我支付半个月租金2100元。  
**综上,您应退还我4620元**(2520+4200-2100)。  

您的两点说法我需澄清:  
① 通用条款第7条与特别约定冲突,根据第9条,应以特别约定为准,故押金需退;  
② 违约金已明确约定为“半个月”,非一个月,请按合同执行。  
期待您按约退款,谢谢!
Kimi 2.6
房东您好,按合同条款算账如下:1.押金4200元,依特别约定第2条应全额退还;2.6月已付4200元,按特别约定第3条,日租140元,12日退租当天计入共12天,应付1680元,应退2520元;3.违约金为半个月租金2100元。综上,您应净退4620元。关于押金,通用条款第9条明确"特别约定为准",第2条已约定全退;关于违约金,第2条明确是"半个月"而非一个月。我5月10日已提前30天通知且费用结清,请您核算。
Grok
房东您好,依合同算清退款。5月10日微信通知,6月12日搬离,提前超30天,适用特别约定第2条(工作调动,30天以上通知+结清费用,押金全额退还,另付半个月违约金)。第3条日租140元,住12天应缴1680元,已付4200元,多退2520元。押金4200元,扣违约金2100元,净退4620元。

您说通用第7条押金不退,但特别约定优先且明确可退;违约金合同写的是半个月而非一个月。请退款4620元,谢谢。
DeepSeek V4 Pro
房东您好,我跟您梳理一下合同,账算清楚就明了了。  
按特别约定第2条(手写补充)并依据第9条,因工作调动退租,我已提前33天(5月10日)书面通知并结清全部费用,押金4200元应全额退还。  
违约金按特别约定第2条明确为半个月租金,即4200÷2=2100元,并非一个月。  
6月租金我已付4200元,6月12日交房,按特别约定第3条,日租140元,住12天计1680元,剩余2520元应退我。  
所以您净应退我:押金4200 + 租金剩余2520 - 违约金2100 = 4620元。  
以上都有合同和记录为证,麻烦您核对后安排退款,谢谢您。
Gemini
您好,关于退租费用,依据合同特别约定核算如下:
1. 租金结算:6月住12天,日租140元,应退4200-(140×12)=2520元;
2. 净退总额:押金4200+多交租金2520-半月违约金2100=4620元。
针对您的异议,依通用条款第9条,特别约定优于通用条款。我因调动已于5月10日提前通知,符合特约第2条,押金应全额退还,且违约金明确为半个月而非一个月。合同是咱们共同签字认可的,还请按约定退还款项,谢谢。
Kimi 2.7 Code
房东您好,按合同条款算账:①押金4200元,特别约定第2条明确因工作调动提前30天通知并结清费用则全额退还;②违约金为半个月租金2100元;③6月我住到12日,按日租140元计12天共1680元,我已付整月4200元,多付2520元应退还。综上,您应净退4200+2520-2100=4620元。

关于"租期未满押金不退",通用条款第9条规定"特别约定与通用条款不一致的,以特别约定为准",手写补充已优先明确;关于"违约金起码一个月",同条也明确为半个月租金。请您按合同履行,谢谢。
🇯🇵 S-03
2026年6月20日(土)、あなたは大学院生の三好航大。今夜19時から、南山田駅近くの居酒屋「炭火や ぐり」で、留学する先輩・真壁さんの送別会がある。あなたは終電で、白根公園駅近くの自宅に帰らなければならない。条件は次のとおり。①居酒屋から南山田駅までは徒歩8分。②南山田駅から栗木橋駅までは青葉急行で所要26分。青葉急行は21時台から23時台まで毎時10分・30分・50分発。③栗木橋駅で花見台線に乗り換える。改札と階段の移動があるため、乗り換えには最低6分必要(6分未満では乗れない)。④花見台線の栗木橋発の終電は23時18分で、白根公園駅まで所要14分。⑤白根公園駅から自宅までは徒歩10分。あなたは幹事でもある真壁さんに、先に失礼することをLINEで伝えたい。まず、乗るべき南山田発の電車の時刻、居酒屋を出なければならない最終時刻、自宅に着く時刻を、計算の道筋がわかる箇条書きで示すこと。そのうえで、先輩への感謝と中座のお詫びを込めた、自然な敬語のLINEメッセージ(150〜220字)を書きなさい。
7 个模型的完整回答(点开对比):
GPT-5.5
- 栗木橋発の花見台線終電は23:18。
- 乗り換えに最低6分必要なので、栗木橋には23:12までに着く必要がある。
- 南山田22:50発は栗木橋23:16着で間に合わない。
- 南山田22:30発なら栗木橋22:56着で間に合う。
- したがって乗るべき電車は南山田22:30発。
- 居酒屋から駅まで徒歩8分なので、居酒屋を出る最終時刻は22:22。
- 白根公園23:32着、自宅までは徒歩10分なので、自宅到着は23:42。

真壁さん、本日は送別会にお招きいただきありがとうございます。留学前に直接お話しできて、とてもありがたく思っています。大変恐縮なのですが、終電の都合で22時20分過ぎには先に失礼します。途中退出となり申し訳ありません。ご留学先でのご活躍を心より応援しています。
MiMo 2.5 Pro
## 計算の道筋

**終電ルートから逆算します。**

- **花見台線終電**:栗木橋発 **23:18** → 白根公園着 **23:32**(所要14分)
- **乗り換えに最低6分必要** → 栗木橋駅には **23:12 まで**に到着しなければならない
- **青葉急行の候補(22時台〜23時台)**:
  - 22:30発 → 栗木橋着 **22:56** → 22:56+6分=23:02 ≦ 23:18 ✅ **乗車可能**
  - 22:50発 → 栗木橋着 23:16 → 23:16+6分=23:22 > 23:18 ❌ 乗車不可
  - 23:10発 → 栗木橋着 23:36 > 23:18 ❌ 終電発済

### 箇条書きまとめ

1. **乗るべき電車**:南山田駅 **22:30発** 青葉急行
2. **栗木橋駅着**:22:56(乗り換え6分 → 23:02に花見台線ホームへ)
3. **花見台線終電**:栗木橋発 **23:18** → 白根公園着 **23:32**
4. **自宅着**:23:32+徒歩10分= **23:42**
5. **居酒屋を出なければならない最終時刻**:22:30-徒歩8分= **22:22**

---

## LINEメッセージ(158字)

> 真壁さん、本日は素敵な送別会を企画してくださり、本当にありがとうございました。日頃から温かいご指導とお心遣いをいただき、深く感謝申し上げております。終電の関係上、22時過ぎに先に失礼させていただきます。誠に申し訳ございません。留学先での素晴らしい日々とご多幸を心よりお祈り申し上げます。どうぞお体をお大事に。
Kimi 2.6
【計算の道筋】

- 花見台線の終電は栗木橋23:18発。改札と階段の移動を含め、乗り換えには最低6分必要なので、青葉急行の栗木橋着は23:12が最遅。
- 青葉急行は栗木橋まで26分かかるため、南山田発は理論上23:12から26分前の22:46が最遅。
- しかし青葉急行の実際の時刻は毎時10・30・50分発なので、22:46以前で最も遅いのは22:30発。
- 22:30発は栗木橋に22:56着。23:18発の花見台線まで22分あり、6分未満ではないため乗り換え可能。次の22:50発は栗木橋に23:16着で、乗り換え時間が2分となり6分未満なので不可。
- 南山田駅まで徒歩8分必要なので、居酒屋を出る最終時刻は22:30の8分前である22:22。
- 花見台線の終電は23:18発で、白根公園駅までは14分。23:32着。駅から徒歩10分なので、自宅には23:42に着く。

【LINEメッセージ】

真壁先輩、本日はお忙しいところ送別会を開いていただき、誠にありがとうございます。先輩からお話を伺うたびに、研究への姿勢や留学への強い意志に感銘を受けておりました。楽しい時間を頂戴しており恐縮ですが、終電の関係で22:22頃に中座させていただきます。短い時間となりますが、最後まで楽しみたいと思います。先輩の新天地でのご活躍を心よりお祈りしております。どうぞお気をつけて行ってらっしゃいませ。三好航大
Grok
・花見台線の栗木橋駅発終電は23時18分で、白根公園駅まで14分、23時32分着。自宅まで徒歩10分のため、自宅到着は23時42分となる。
・この終電に乗るには、栗木橋駅到着を23時12分までとし、改札・階段移動のための最低6分の乗り換え時間を確保する必要がある。
・南山田駅から栗木橋駅までは青葉急行で26分を要する。したがって南山田駅の発車時刻は23時12分より26分前、すなわち22時46分までとなる。
・青葉急行は21時台から23時台まで毎時10分・30分・50分発のため、22時46分以前で最終の便は22時30分発である。
・よって、乗るべき南山田発の電車の時刻は22時30分発の青葉急行。
・南山田駅までは居酒屋から徒歩8分であるため、居酒屋を出なければならない最終時刻は22時30分から8分前となる22時22分である。
・南山田22時30分発→栗木橋22時56分着→6分以上の乗り換えで23時18分発花見台線→白根公園23時32分着→徒歩10分で23時42分自宅着。

真壁さん、こんばんは。
本日は送別会を開いていただき、誠にありがとうございます。留学のご出発、おめでとうございます。
幹事として最後までおもてなしをするつもりでしたが、終電の都合上、22時22分頃に居酒屋を失礼しなければなりません。申し訳ございません。
中座となってしまい大変心苦しいのですが、ぜひ皆さんで楽しいひとときをお過ごしください。
これまで大変お世話になりました。留学先でもお体に気をつけてご活躍ください。
三好航大
DeepSeek V4 Pro
・乗るべき南山田発の電車の時刻:22時30分
 ─ 花見台線の栗木橋発終電は23時18分。乗換に最低6分必要なため、栗木橋到着は23時12分まで。
 ─ 青葉急行の南山田→栗木橋は所要26分。したがって南山田発は22時46分までに乗る必要あり(23:12−26分=22:46)。
 ─ 青葉急行は21時台〜23時台まで毎時10・30・50分発。22時46分以前の最終は22時30分発(次発22時50分は栗木橋着23時16分で乗換不可)。

・居酒屋を出なければならない最終時刻:22時22分
 ─ 南山田駅まで徒歩8分のため、22時30分−8分=22時22分。

・自宅に着く時刻:23時42分
 ─ 22時30分発青葉急行→22時56分栗木橋着。
 ─ 23時18分発花見台線→23時32分白根公園着、徒歩10分→23時42分着。

真壁先輩、今晩の送別会、本当に楽しい時間をありがとうございます。留学先でのご活躍を心から応援しています。私も何とか幹事を務めさせていただきましたが、終電の関係で22時22分までにお店を出なければならず、途中で失礼いたします。本来なら最後までお見送りすべきところ、大変申し訳ありません。帰宅後、改めてご挨拶のメッセージをお送りします。どうか最後まで楽しんでください。
Gemini
### 帰宅時間の計算

終電から逆算して、各地点の時刻を割り出します。

*   **花見台線の終電(白根公園駅行)**: 栗木橋駅 **23:18発**
*   **栗木橋駅への到着期限**: 23時12分(乗り換えに最低6分必要なため)
*   **南山田駅の発車期限**: 22時46分(栗木橋までの所要時間26分を逆算:23:12 - 26分)
*   **乗るべき南山田発の電車**: **22時30分**(青葉急行は10分・30分・50分発のため。22時50分発では栗木橋着が23時16分となり、乗り換え時間が2分しかなく間に合いません)
*   **居酒屋を出る最終時刻**: **22時22分**(南山田駅まで徒歩8分のため:22:30 - 8分)
*   **白根公園駅への到着時刻**: 23時32分(23:18発 + 所要時間14分)
*   **自宅に着く時刻**: **23時42分**(白根公園駅から徒歩10分のため:23:32 + 10分)

---

### 真壁さんへのLINEメッセージ

真壁さん、本日は送別会を企画していただきありがとうございます。主役の真壁さんが幹事まで務めてくださっているのに、先に失礼してしまい申し訳ありません。自宅方面への終電が早いため、22時20分過ぎには店を出る予定です。

これまで真壁さんには研究室で何度も助けていただき、本当に感謝しています。留学先でのさらなるご活躍を心から応援しております。現地に落ち着かれましたら、ぜひ近況を教えてください。道中お気をつけて!
Kimi 2.7 Code
**【計算の道筋】**

- 花見台線の栗木橋駅発終電は23:18。白根公園駅までは14分かかるため、23:32着。
- 白根公園駅から自宅までは徒歩10分なので、自宅到着時刻は23:42。
- 栗木橋駅で花見台線に乗り換えるには最低6分必要なので、青葉急行は23:12(23:18-6分)までに栗木橋駅に到着していなければならない。
- 青葉急行は南山田駅から26分かかるため、南山田駅発は23:12-26分=22:46までに発車する必要がある。
- 青葉急行の時刻(21〜23時台、毎時10・30・50分発)で、22:46以前の最終列車は22:30発。
- 22:30発の青葉急行は栗木橋駅22:56着。23:18発の花見台線まで22分あり、6分以上の乗り換え条件を満たす。
- 居酒屋から南山田駅までは徒歩8分なので、出なければならない最終時刻は22:30-8分=22:22。

**【結論】**
- 乗るべき南山田発の電車:**22:30**
- 居酒屋を出なければならない最終時刻:**22:22**
- 自宅に着く時刻:**23:42**

---

**【LINEメッセージ】**

真壁さん、今日はお世話になりました。楽しい時間をご一緒でき、心から感謝しています。私事で恐縮ですが、終電の関係で22:30に南山田を発つ電車に乗るため、22:22頃にはお先に失礼させていただきます。短い時間でしたが、先輩の温かいお人柄に改めて触れ、大変励みになりました。留学先でもお元気でお過ごしください。お体に気をつけてください。三好

(166字)
🇯🇵 S-04
2026年6月、あなたは佐伯文乃。72歳の祖母・美津江さんのスマホ代を見直している。祖母の使い方は決まっていて、データは月3GBで足り、電話は昔からの友人との長電話だけ——月に2回、1回あたり30分(月合計60分)。選択肢は3つ。(1)現在の「つばさモバイル ベーシック3」のまま:基本料 月2,980円、通話料は30秒ごとに11円。(2)「ことりSIM シニア割」へ乗り換え:基本料 月1,780円(データ3GB付き)+「10分かけ放題」オプション 月880円。このかけ放題は1回の通話につき10分まで無料で、1回の通話で10分を超えた分には30秒ごとに11円かかる。乗り換え時に初期手数料3,300円が一度だけかかる。(3)同じつばさモバイルの「完全かけ放題パック」へプラン変更:月3,480円(通話は時間無制限・データ3GB)、変更手数料なし。これから12か月の総額を3つとも計算し、どれがいちばん安いかを確かめなさい。3つの12か月総額の計算はメッセージの前に示すこと。そのうえで、祖母に宛てて、専門用語を使わずに結論と理由をやさしく伝える手紙ふうのメッセージ(です・ます調、150〜250字)を書きなさい。
7 个模型的完整回答(点开对比):
GPT-5.5
(1)現在のまま:2,980円+1,320円=4,300円/月、4,300円×12=51,600円  
(2)ことりSIM:1,780円+880円+880円=3,540円/月、3,540円×12+3,300円=45,780円  
(3)完全かけ放題パック:3,480円×12=41,760円  

美津江おばあちゃんへ。12か月分で比べると、いちばん安いのは、つばさモバイルの完全かけ放題パックでした。今のままだと電話代が高くなり、ことりSIMも最初のお金と長電話の追加分があります。完全かけ放題なら、友だちと30分話しても料金を気にしなくて大丈夫です。
MiMo 2.5 Pro
**12か月総額の計算**
(1)つばさモバイル ベーシック3のまま  
基本料2,980円+通話料1,320円(60分×22円/分)=月額4,300円  
12か月総額:4,300円×12=**51,600円**

(2)ことりSIM シニア割へ乗り換え  
初期手数料3,300円+(基本料1,780円+オプション880円+超過通話料880円)×12か月  
=3,300円+3,540円×12=3,300円+42,480円=**45,780円**

(3)完全かけ放題パックへプラン変更  
月額3,480円×12か月=**41,760円**

→ 最も安いのは(3)の41,760円です。

---

おばあちゃん、こんにちは。文乃です。  
スマホ代を見直しました。今のプランは、長電話の通話料が毎月1,300円くらいかかっていて、1年で51,600円になります。  
もし「ことりSIM」に変えると、通話料は少し安くなりますが、乗り換え手数料がかかるので、1年で45,780円です。  
おすすめは、今の会社のまま「完全かけ放題」に変えること。毎月3,480円で、いつでも好きなだけ電話できて、追加料金は一切かかりません。1年トータルで41,760円と、3つの中でもっともお手頃です。  
設定換えも簡単なので、一緒にお店に行きましょうね。
Kimi 2.6
**【12か月総額の計算】**

(1)つばさモバイル ベーシック3のまま  
 基本料2,980円+通話料(30秒11円×120回×2回=1,320円)=月4,300円  
 12か月総額:4,300円×12=51,600円

(2)ことりSIM シニア割  
 基本料1,780円+「10分かけ放題」オプション880円+通話超過料(30秒11円×40回×2回=880円)=月3,540円  
 12か月総額:3,540円×12+初期手数料3,300円=45,780円

(3)つばさモバイル 完全かけ放題パック  
 月3,480円(変更手数料なし)  
 12か月総額:3,480円×12=41,760円

---

**おばあちゃんへのメッセージ**

おばあちゃん、スマホのお金を計算しました。今のままだと1年で51,600円、別の会社に変えると45,780円、今の会社で電話をたくさんかけても同じお金になるように変えると41,760円でした。お友達と長くお話しするのが大好きなおばあちゃんには、今の会社の新しい支払いの仕方がいちばん安くて安心です。お店で手続きをするお金もかからず、毎月のお金も抑えられます。これからもたっぷりお話ししてください。
Grok
(1)現在の「つばさモバイル ベーシック3」のまま:(2,980円+1,320円)×12=51,600円
(2)「ことりSIM シニア割」へ乗り換え:(1,780円+880円+880円)×12+3,300円=45,780円
(3)「完全かけ放題パック」へ変更:3,480円×12=41,760円
一番安いのは(3)の41,760円です。

おばあちゃんへ

携帯の料金を調べてみました。おばあちゃんは月に2回、30分ずつお友達とお話しになるだけですね。

今のままですと、話した分だけお金がかさんでしまいます。

同じ会社の、いつでも好きなだけ話せるコースに変えると、毎月決まった金額だけで済み、1年で見ると今よりずっと安くなります。手続きのお金もかかりませんし、ネットも今と同じで十分です。

おばあちゃんの使い方にはぴったりだと思いますので、変えてみてはいかがでしょうか。安心して長くお話しできますよ。
DeepSeek V4 Pro
【12か月の総額計算】
(1) 現在の「つばさモバイル ベーシック3」のまま
 基本料:2,980円/月
 通話料:60分(3,600秒)→120回(30秒ごと)×11円=1,320円/月
 月額:2,980+1,320=4,300円
 12か月:4,300×12=51,600円

(2) 「ことりSIM シニア割」へ乗り換え
 基本料:1,780円/月(データ3GB込み)
 10分かけ放題オプション:880円/月
 超過通話料:1回30分→10分無料、残り20分(1,200秒)→40回×11円=440円/回、月2回で880円
 月額:1,780+880+880=3,540円
 初期手数料:3,300円(一度だけ)
 12か月:3,540×12+3,300=45,780円

(3) 同じつばさモバイルの「完全かけ放題パック」へプラン変更
 月額:3,480円(通話かけ放題・データ3GB)
 変更手数料:なし
 12か月:3,480×12=41,760円

---
祖母へのメッセージ:
おばあちゃん、スマホの料金を見直してみました。今のまま使うと1年で5万円以上になっちゃうけど、同じ会社の「完全かけ放題パック」に変えると、今より月々の支払いが下がって、1年で41,760円になります。友だちとの長電話も何分話しても料金が増えないから、安心してたくさんおしゃべりできます。手続きのお金もかからないし、いちばんお財布にやさしいので、このプランに変えるのがおすすめです。
Gemini
### 12か月間の総額計算

**(1) つばさモバイル ベーシック3(現在のまま)**
*   基本料:2,980円 × 12か月 = 35,760円
*   通話料:1,320円(月60分:22円/分) × 12か月 = 15,840円
*   **12か月総額:51,600円**

**(2) ことりSIM シニア割(乗り換え)**
*   基本料+オプション:(1,780円 + 880円) × 12か月 = 31,920円
*   超過通話料:880円(1回につき10分を超えた20分×月2回) × 12か月 = 10,560円
*   初期手数料:3,300円(一度のみ)
*   **12か月総額:45,780円**

**(3) つばさモバイル 完全かけ放題パック(プラン変更)**
*   月額:3,480円(通話無制限・データ3GB) × 12か月 = 41,760円
*   **12か月総額:41,760円**

**【結論】**
3つの中で最も安いのは **(3) つばさモバイル「完全かけ放題パック」へのプラン変更** です。

---

### おばあちゃんへのメッセージ

おばあちゃん、いつも楽しいお話をありがとう。スマホ代を計算してみたよ。今のままだとお友達との長電話で通話料が高くなっちゃうみたい。

一番のおすすめは、今の会社のままで「完全かけ放題」というプランに変えることだよ。1年間で計算すると、今のままより1万円くらい安くなるし、他の会社に変えるより手間もかからなくて一番安いの。

これなら時間を気にせずたっぷりお喋りを楽しめるから安心だよ。今度会った時に、一緒に手続きをしようね。
Kimi 2.7 Code
12か月の総額は以下の通りです。

(1)つばさモバイル ベーシック3のまま:基本料2,980円×12か月+通話料1,320円×12か月=51,600円  
(2)ことりSIM シニア割+10分かけ放題オプション:基本料1,780円×12か月+オプション880円×12か月+通話超過料880円×12か月+初期手数料3,300円=45,780円  
(3)つばさモバイル 完全かけ放題パック:3,480円×12か月=41,760円

おばあちゃんへ。スマホのお金を計算しました。今のままだと1年で51,600円、別の会社に変えると45,780円、今の会社の好きなだけ電話できるものに変えると41,760円です。いちばん安いのは最後のもので、お友達と長くお話ししても料金が増えず、12か月で4,000円以上もお得になります。おまけに変えるときの手数料もかかりません。早速変えましょう。文乃より

📐 方法学与边界