日本語の大規模言語モデルが続々登場

現状では生成AIを動かすにはそれなりのPCのスペックが必要になりますので、ChatGPTのようにサーバーに接続して使う方法が主流です。しかし、セキュリティの問題や利用料といったコストの問題がありますので、できればローカルで動かしたいところです。

ここ最近、急速に日本語の大規模言語モデルが出てきて、手元でいろいろと試すことができるようになってきました。これからも出てくるとのことなので、楽しみです。

目次

ChatGPT

無料版のChatGPT3.5でもそれなりに満足できるアウトプットが出て来るようになりました。日本語でも特に違和感がありません。プログラミングの知識がなくても動かせますので、手軽に試すことができます。

ただし、こちらはネットに繋ぐ必要がある上、入力する場合には個人情報や機密情報を入れない、といった注意事項を守る必要があります。

Metaの生成AI

2023年8月に、コード生成用AI「Code Llama」をリリースしました。

2023年7月には、大規模言語モデル「Llama 2」をオープンソースとして公開しています。ただし、これは英語限定です。

CyberAgentのOpenCALM

2023年5月にサイバーエージェント社が日本語に特化したLLMを無償公開しました。

パラメータ数の違いで6種類(small、medium、large、1b、3b、7b)のモデルがあります。

動かすためには、Pythonが使えることが前提となります。MacBook Pro M1 Pro メモリ16GBではlargeモデルが限界かと思います。それでも、かなり良い結果が出ますので、ローカルでこれだけのことができることに驚きです。

東京大学松尾研究室のWeblab-10B

こちらは、2023年8月に発表されたモデルです。現状では国内最高水準だそうですが、商用不可のため、オープンソースではありません。今後、商用利用可能モデルも検討していくとのことなので、それを待ちたいと思います。

産総研のスパコンを利用して、PFNが開発中

産総研のスパコン「ABC I」を利用して、PFN(プリファードネットワーク)が日本語での精度を高めた大規模言語モデルを開発中とのこと。2023年10月頃にオープンソースとして公開予定とのことですので、これも楽しみです。

目次