この記事の要点は？

NIIが日本語に強い大規模言語モデル「LLM-jp-4」を8Bと32B-MoEの2モデルでオープンソース公開。一部ベンチマークでGPT-4oを上回る性能。

Apr 4, 2026

国立情報学研究所がLLM-jp-4をオープンソース公開！日本製LLMの新たな一歩

ITニュース解説 AI 2026年4月

LLM-jp-4 のモデル構成とベンチマーク比較

ひよこ

NIIっていうところがLLM-jp-4っていうAIを公開したんだって？

ペンギン先生

そうだよ。国立情報学研究所（NII）が2026年4月3日に、日本語に強い大規模言語モデル「LLM-jp-4」をオープンソースで公開したんだ。国の研究機関が本格的なLLMを誰でも使える形で出すのは、かなり大きなニュースだね。

ひよこ

オープンソースってことは、誰でもタダで使えるの？

ペンギン先生

その通り。企業でも個人でも自由にダウンロードして使えるし、中身を改造したり、自分のサービスに組み込んだりもできるよ。ChatGPTやClaudeみたいな商用モデルは中身がブラックボックスだけど、オープンソースならモデルの重みやアーキテクチャを誰でも検証できるんだ。透明性と信頼性の面でとても重要だよ。

ひよこ

今回は2つのモデルがあるって聞いたけど、どう違うの？

ペンギン先生

8Bモデルと32B-A3Bモデルの2種類だよ。8Bは約86億パラメータの通常モデルで、32B-A3BはMoEという特殊なアーキテクチャを使った約320億パラメータのモデルなんだ。どちらも約12兆トークンの高品質なデータで学習されているよ。

ひよこ

MoEって何なの？普通のモデルと何が違うの？

ペンギン先生

MoEは「専門家の混合」という意味で、モデルの中に複数の専門家（エキスパート）ネットワークを持っていて、入力に応じて一部のエキスパートだけを使う仕組みだよ。32Bモデルは全体で320億パラメータあるけど、推論時に実際に動くのは約30億パラメータだけ。つまり、大きなモデルの賢さを持ちながら、計算コストは小さいモデル並みで済むんだ。

ひよこ

すごい！それで性能はどのくらいなの？

ペンギン先生

一部の日本語ベンチマークではGPT-4oやQwen3-8Bを上回るスコアを出しているよ。ただし注意が必要で、「一部のベンチマーク」というのがポイント。特定のタスクで上回っていても、総合力ではまだ商用モデルに及ばない部分もある。とはいえ、オープンソースの日本語モデルとしてはトップクラスの性能と言っていいね。

ひよこ

でも、なんで国の研究機関がわざわざLLMを作るの？ChatGPTとかを使えばいいんじゃないの？

ペンギン先生

いい質問だね。海外の商用モデルだけに頼ると、いくつかリスクがあるんだ。まず、日本語の扱いが英語ほど得意じゃないことがある。それに、政府や企業の機密データを海外のAPIに送ることへの懸念もある。自国で高性能なモデルを持つことは「AIの主権」とも言える重要な戦略なんだよ。

ひよこ

日本では他にもLLMを作っているところがあるの？

ペンギン先生

あるよ。NTTの「tsuzumi」、ABEJAの「ABEJA LLM」、Preferred Networksの「PLaMo」、サイバーエージェントの日本語モデルなど、民間企業も積極的に開発しているんだ。ただ、NIIのように国の研究機関が大規模モデルをオープンソースで出すのは意味合いが違う。誰でも研究や開発に使える共通基盤を提供しているんだよ。

ひよこ

でも、OpenAIとかGoogleとか何兆円も投資している会社と戦えるの？

ペンギン先生

正面から同じ土俵で戦うのは確かに難しい。でもオープンソースの強みは、世界中の研究者やエンジニアが改良に参加できること。Metaが出したLlamaシリーズも、公開後にコミュニティが驚くほどの改良を加えたよね。NIIも2026年度中にさらに大きなモデルや軽量モデルを公開する予定で、継続的にエコシステムを育てていく方針なんだ。

ひよこ

12兆トークンのデータってどこから集めてきたの？

ペンギン先生

詳細は公開情報から読み取れる範囲だけど、日本語のWebデータ、書籍、論文、コードなど多様なソースから高品質なものを厳選しているよ。実はデータの質こそがLLMの性能を左右する最大の要因なんだ。12兆トークンは量としても相当だけど、それ以上に「日本語のデータをどれだけ丁寧に集められるか」が日本製モデルの勝負どころだね。

ひよこ

これからの日本のAI開発はどうなっていくのかな？

ペンギン先生

オープンソースモデルが充実することで、大学や中小企業でもLLMを使った研究・サービス開発がしやすくなるのが一番大きいね。今までは高額なAPI利用料を払うか、自前で何億円もかけて学習するかの二択だったけど、LLM-jp-4のようなモデルがあれば、ファインチューニングして自社の業務に特化させることもできる。AI研究の民主化が進む大事な一歩だよ。

国立情報学研究所がLLM-jp-4をオープンソース公開！日本製LLMの新たな一歩

関連コラム