share

公開日 

更新日 

  • 生成AIニュース

OpenAI o1を超える!?アリババ「Marco-o1」とは?

2024年11月27日、中国企業アリババの研究部門「アリババ研究院」から新しいモデル「Marco-o1」が発表されました。

OpenAIが発表した大規模推論モデル「OpenAI o1」を超える性能を目指して開発され、深く細かい推論能力が備わっています

本記事では、「Marco-o1」の概要や能力、活用シーンについて解説します。

「研究でより深く推論していきたい」「ニュアンスも汲んだ翻訳をしたい」という方はぜひ最後までご覧ください。

監修者

SHIFT AI代表 木内翔大

(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員9,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は9.7万人超え(2024年12月現在)

弊社SHIFT AIでは、さまざまな生成AIを活用したAI副業の始め方や、AI人材となってキャリアアップする方法などを解説する無料セミナーを無料で開催しています。

ご興味のある方は、ぜひ以下のリンクからセミナーにお申し込みください。

【無料】AI人材の一歩目!

アリババの新モデル「Marco-o1」とは?

人工知能の進化は、私たちの想像をはるかに超える速さで進んでいます。

その最先端を走るのが、アリババが開発した「Marco-o1」という革新的なAIモデルです。

「Marco-o1」は中国企業アリババが開発した最新のAIシステムで、OpenAIのモデル「OpenAI o1」の影響を受け、アリババ社Qwenグループの大規模言語モデル「Qwen2-7B」をベースとして作られました。

人工知能の世界に新しい風を吹き込む画期的なツールで、以下4つの活用により、複雑なタスク処理に長けています

  • 思考連鎖(CoT):1つずつ順を追う人間のような思考をAIに再現する
  • 自己批判的推論アプローチ:AIが自分の答えを自分で点検・評価する
  • モンテカルロ木探索(MCTS):枝分かれした木のように思考する
  • リフレクションメカニズム:経験から学び改善点を見つける人間の内省プロセスをAIに再現する

「Marco-o1」はオープンソースモデルとしてHugging Faceで公開されています。

推論能力の向上

「Marco-o1」は従来のAIとは一味違い、複雑なタスク処理ができ、推論能力が向上しています。以下図のように、3種類のデータセットを組み合わせた学習・調整が行われました。

Marco-o1を構築したファインチューニング
Marco-o1を構築したファインチューニング
参照:arXiv, Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

AIの行動選択の粒度に注目し、より細かく推論を進められるよう、「ミニステップ」と呼ばれる64または32トークの小単位に分割して実験されました。

また、「Marco-o1」は思考の最後に自己反省を行います(振り返りメカニズム)。以下引用のように、思考するだけでなく、最後に考え直すプロセスがあるのです。

Wait! Maybe I made some mistakes! I need to rethink from scratch.

【日本語訳】
待った!私は間違いを犯したかもしれない!最初から考え直す必要がある。

引用:arXiv, Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

これらの結果、「Marco-o1」より複雑で細かい推論が可能になり、最適解を導き出すのに効果的な能力を発揮します。

「Marco-o1」はMGSMベンチマークにおいて、ベースである「Qwen2-7B」を大きく上回る結果となりました。
※Multilingual Grade School Mathベンチマーク:多言語環境における推論能力を評価するためのベンチマーク

「Marco-o1-MCTS」では、英語のデータセットでは最大+6.4%※、中国語のデータセットで最大+5.60%の精度向上を達成しています。

「Marco-o1-MCTS」は、作成済みの「Marco-o1-CoT(思考連鎖を組み込んだモデル)」を採用したうえで、モンテカルロ木探索(MCTS)も採用したモデルです。

※論文内『1. Introduction』には「英語のデータセットでは+6.17%」と記載がありますが、資料データを参照すると「+6.4%」となります。

MGSMデータセットによる推論能力の調査結果
MGSMデータセットによる推論能力の調査結果
参照:arXiv, Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

以下の画像は、Marco-o1が古典的なストロベリー問題(「strawberry」の中に「r」は何個ありますか)に取り組んだ結果です。

「Marco-o1」の「ストロベリー」の問題に対する推論
「Marco-o1」の「ストロベリー」の問題に対する推論
参照:arXiv, Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

「strawberry」に対し1つずつ順を追って確認し、回答は「3」と正解しています。

さらに最後の文字「y」については、人間が「もう考えなくてよい」と判断するように思考を省略しました。

この結果からも、「Marco-o1」はまるで人間のような思考プロセスで細かな推論を行えるとわかります。

テキストからニュアンスを汲みとる能力

「Marco-o1」は、まるで賢い通訳のように働く次世代AIシステムです。

人間の脳の仕組みを模倣し、言葉の背景にある深い意味を理解できる革新的な仕組みを持っています。

従来のAIは、文字通りの意味しか理解できませんでしたが、「Marco-o1」は文脈や状況を読み取り、まるで人間のように柔軟に思考できます。

この柔軟な思考はモンテカルロ木探索(MCTS)を組み込むことで可能となりました。

「Marco-o1」のテストでは、中国語の文章を英語に訳した際、口語的なニュアンスを汲みとった正確な翻訳を行いました(以下画像参照)。

中国語の文章に、口語的なニュアンスを汲みとった正確な英訳を行った
中国語の文章に、口語的なニュアンスを汲みとった正確な英訳を行った
参照:arXiv, Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

「Marco-o1」の活用シーン

「Marco-o1」は、単なる技術的な進歩ではなく、人間の可能性を拡張する革新的なツールとして、さまざまな分野での応用が期待されています。

言語の壁を越え、複雑な課題を解決してくれる「Marco-o1」は、以下のようなシーンで活用できるでしょう。

  • 教育や学習支援
  • 研究開発支援
  • グローバルなビジネスコミュニケーション
  • カスタマーサポート

複雑あるいは抽象的な概念であっても、「Marco-o1」であれば段階的な思考が叶うでしょう。この点は、教育や学習、研究開発の強大なサポートとなります。

ニュアンスや文脈を汲む力は、人間的な意図を含む会話、とくにグローバルなビジネスコミュニケーションやカスタマーサポートで役立つでしょう。

「Marco-o1」は深く細かく思考する推論モデル

従来のAIモデルは、日々進化する中で「考える」という行為、そして回答の精度を高めてきました。

対して「Marco-o1」は、じっくり考え自己反省も行うことで、深く細かい推論を可能にしています。

テキストから文脈やニュアンスを汲む能力も持っているので、これまでのAIモデルよりも、まるで人間と議論しているような活用ができるでしょう。

弊社SHIFT AIでは、さまざまなAIを活用して、これからの時代に必要とされる「AI人材」になるための資料を配布しております。

無料で参考にしていただけますので、ぜひお気軽にダウンロードしてください。

無料 & 30秒で完了!

記事を書いた人

木村凛日

フリーランスのSEOライター・ディレクター。
AIツールを活用したリサーチ・画像生成を日々行っています。
200名以上のWebライターの育成経験あり。
メディア分析・リライトも担当しています(他メディア)。
パンダが好きです。