オープンAIモデルは安全か？

本ブログは Are Open AI Models Safe? (By IRVING WLADAWSKY-BERGER | 2023年6月2日) の参考訳です

最近のNYタイムズの記事「In Battle Over A.I., Meta Decides to Give Away Its Crown Jewels」によると、Facebook、Instagram、WhatsAppを所有するテクノロジー大手Metaは、最先端の大規模言語モデル（LLM）であるLLaMAのオープンソース化を決定し、適切な審査を経た後、そのコードを大学や政府機関の研究者などに公開することにしました。Metaの行動は、AIシステムの基盤となるソフトウェアを独占的なままにしている、AIにおける主なライバルであるGoogleやOpenAIの行動とはまったく異なるものです。

「創業者であり最高経営責任者であるMark Zuckerbergによって率いられているMetaは、その影響力を広め、最終的に未来に向けてより速く前進する方法として、基盤となるA.I.エンジンを共有することが最も賢いことだと考えている」と記事は述べています。MetaのチーフAIサイエンティストであるYann LeCun ニューヨーク大学教授は、最近のインタビューで、GoogleやOpenAIの秘密主義が強まっているのは「大きな間違い」だと指摘し、AIがアメリカの有力企業数社の管理下にあれば、消費者や政府はAIを受け入れることを拒否するだろうと主張しています。LeCunは、Geoffrey Hinton、Yoshua Benjioとともに、ディープラーニングに関する先駆的な研究に対して、「コンピューティング界のノーベル賞」とも言われる2018年チューリング賞を受賞しています。

AIに対するMetaのオープンソースへのアプローチは目新しいものではありません。結局のところ、インターネットとワールド・ワイド・ウェブの基盤となっているインフラは、広く使われているLinuxオペレーティングシステムと同様、すべてオープンソースソフトウェアで構築されている。そして2022年9月、Metaはその機械学習フレームワークであるPyTorchをLinux Foundationに寄贈し、技術の開発とアクセシビリティをさらに加速させました。

しかし、LLaMAをオープンソース化するというMetaの決断に誰もが賛成しているわけではありません。GoogleやOpenAIなどは、このような強力なテクノロジーに対するオープンソースのアプローチは危険だとMetaを批判しています。また、オープンソースのAIモデルに反対する理由のひとつが、自社独自のモデルに対する競争上の脅威となりうるからではないかとの意見もあります。” Googleに参入障壁はないがOpenAIも同じ “と簡潔に宣言したGoogleのメモが流出したことからも明らかです。

「私たちのモデルは、品質という点ではまだわずかな優位を保っていますが、その差は驚くほど急速に縮まっています。」とメモに書かれており、「オープンソースのモデルは、より高速で、よりカスタマイズ可能で、よりプライベートであり、より強力な機能を備えています。彼らは、我々が1,000万ドルと5,400億のパラメーターで苦労していることを、100ドルや130億のパラメーターを使って実現している。しかも、数カ月ではなく数週間でやってのける。これは我々にとって重大な意味を持っています。」という記述もあります。メモには、さらに以下のような指摘があります：

「私たちには秘密のソースはありません。私たちの最大の望みは、Google以外の他の企業がやっていることから学び、協力することです。私たちは、3P（サードパーティ）の統合を可能にすることを優先すべきです。」
「無料の制限のない代替品が同等の品質である場合、人々は制限のあるモデルにお金を払うことはありません。自分たちの付加価値はどこにあるのかを考える必要があります。」
「巨大なモデルは私たちの動きを遅くしています。長期的には、素早く反復できるモデルが最善です。200億パラメーター未満のモデルで可能なことがわかったので、小さなモデルのバリエーションを作る事を後回しにせず、真剣に取り組むべきです。」

リークされたGoogleのメモに書かれている主張は、目新しいものではありません。「テクノロジーの歴史は、オープンソースとプロプライエタリ、あるいはクローズドなシステムとの戦いに満ちています。明日のコンピューティング・プラットフォームを構築するために使用される最も重要なツールを独占する企業もあれば、それらのツールを提供する企業もあります。…多くの企業はこれまで、研究者の強い要望により、自社のA.I.テクノロジーをオープンに共有してきました。しかし、A.I.をめぐる競争のために、彼らの戦術は変わりつつあります。」とNYT(New York Times)の記事に記されています。

プロプライエタリなAIモデルとオープンソースのAIモデルの安全性に関する現在の議論は、米国の国家安全保障や科学技術研究にとって極めて重要なので、スーパーコンピューティングシステムにおけるオープンソースソフトウェアの使用に関する1990年代後半の同様の議論を思い起こさせます。

当時、私は大統領情報技術諮問委員会（PITAC）の産業界の共同委員長を務めており、学術界共同委員長のRaj Reddy CMU教授をはじめ、産業界と学界に均等に分かれる22名のメンバーとともに活動していました。スーパーコンピューティングにおけるオープンソースソフトウェアの使用はまだ新しいものだったので、1999年10月にPITACは、大学、連邦政府機関、国立研究所、スーパーコンピューティングベンダーの専門家を集めたハイエンドコンピューティングのためのオープンソースソフトウェアに関するパネルを開催しました。

パネルは、その後1年間にわたり、多くの会合や公聴会を開催し、2000年10月に最終報告書「ハイエンドコンピューティングを推進するためのオープンソースソフトウェアの開発」を発表しました。私は、この報告書と大統領への送付文書を読み直しました。次の2つの段落が、現在の議論に特に関連しているように思われます。：

オープンソースは高品質のソフトウェアを作成するための実行可能な戦略ですか？「PITACは、オープンソースの開発モデルは、公共、民間、および学術的なパートナーシップの混合を通じて、高品質のソフトウェアを生産するための実行可能な戦略であると考えています。このオープンソースアプローチは、ライセンス契約によって決められた一定の条件の下で、新しいソフトウェアをオープンに共有することを許可し、ユーザーがソフトウェアの機能を変更、研究、拡張することを許可し、その後、同様のライセンス制限の下で変更されたソフトウェアを再配布することを許可するものです。その性質上、このアプローチは政府に、ソフトウェア研究への投資を学界や民間の専門知識を活用するという新たな可能性を提供するものです。」

機密性の高いシステムの開発にオープンソースソフトウェアを使用すべきか？「オープンソースソフトウェアは、従来のプロプライエタリな開発モデルに対して、潜在的なセキュリティ上の利点を提供する可能性があります。具体的には、開発者がソースコードにアクセスすることで、徹底的な調査が可能になり、埋め込まれたトラップドアやトロイの木馬が埋め込まれている可能性を減らすことができます。さらに、オープンソースモデルでは、ソフトウェアのバグを探し、その後修正プログラムを開発するプログラマの数が増えるため、悪意のあるプログラマに悪用される可能性のある領域を減らすことができます。”

同じ頃、Linuxは商用市場で勢いを増しており、IBMは急成長しているこのオペレーティングシステムを積極的に採用するかどうかを真剣に検討していました。最終決定を支援するために、私たちは1999年後半に2つの大規模な企業研究を開始しました。 1つは科学技術コンピューティングにおけるLinuxの使用に焦点を当てたもので、もう1つはインターネットアプリケーションやアプリケーション開発のための大量プラットフォームとしてのLinuxに関するものでした。その年の終わりには、両調査とも、IBM はすべての製品ラインに Linux を採用すべきであり、Linux 開発のパートナーとしてオープン Linux コミュニティと緊密に協力すべきであり、全社的な Linux 活動を調整する IBM 全体の組織を設立すべきであると強く勧告しました。

その提言は受け入れられ、私は新しいIBM Linuxイニシアチブを組織し、率いるよう要請されました。2000年1月10日、私たちはIBMが全社的にLinuxを採用することを発表しました。私たちの発表は、やや複雑な受け止められ方をしました。 Linuxとオープンソースコミュニティに対する私たちの強力なサポートを歓迎する声は多かったのですが、2000年1月当時、Linuxは商用市場ではまだそれほど知られていませんでした。多くの顧客は、IBMのような企業が、ITの主流からかけ離れたイニシアチブを積極的にサポートすることに当惑していました。

それから1年間、私たちはIBMがLinuxとオープンソースコミュニティをサポートする理由を説明するために、かなりの時間を費やしました。 2000年2月3日、私はニューヨークで開催されたLinuxWorldカンファレンスで基調講演を行い、4年前にIBMインターネット部門を発表したときにインターネットを単なるネットワークと見なしたのと同様に、Linuxを単なるオペレーティング・システムとは見ていないと述べました。われわれはLinuxを、インターネットを介したシステム、アプリケーション、情報の統合を助けるオープン・スタンダードに向けた長期的な進化の一部と見なしていました。

オープンソースプロジェクトと開発者の数は、過去20年間で本当に爆発的に増加しました。IBMがHP、Intel、その他数社とともに2000年に組織化を支援したOpen Source Development Labs（OSDL）が前身であるLinux Foundation（LF）の驚くべきカバーしている範囲からも明らかです。

Economist誌の最新記事「リークされたGoogleのメモが明かすAIの未来とは？」は、インターネットといくつかの関連技術がオープンソースソフトウェア上で動いている一方で、基本的なインターネットインフラは、プロプライエタリなソフトウェア上に構築された多くのアプリケーション、プラットフォーム、ツールをサポートし続けていることを私たちに思い出させてくれます。「AIは、オープンソースのAIモデルと、その上に構築された、企業独自のデータやアルゴリズムに基づく独自のモデルの間で、同じようなバランスをとる可能性があります」。「このメモが部分的に正しいとしても、AI技術へのアクセスは、1年前よりもはるかに民主化されるだろう。強力なLLMをノートパソコンで実行できるようになり、望めば誰でも自分のAIを微調整できるようになった。」

「これにはプラスとマイナスの両方の意味がある」とエコノミスト誌は説明しています。「プラス面では、一握りの企業によるAIの独占的な支配の可能性がはるかに低くなります。AIへのアクセスが格段に安くなり、分野全体のイノベーションが加速し、研究者がAIシステムの挙動を分析しやすくなり（独自モデルへのアクセスは制限されていた）、透明性と安全性が高まることになります。しかし、AIへのアクセスが容易になるということは、悪質な行為者が偽情報の生成など悪質な目的のためにシステムを微調整できるようになることも意味します。敵対的な政権が強力なAI技術にアクセスするのを防ごうとする欧米の試みが失敗に終わることを意味します。そして、AIを規制することが難しくなります。

最初の質問に戻ると、高い機密性を持つ強力なAIシステムの開発にオープンソースソフトウェアやコミュニティを活用することは安全なのでしょうか？コンピューティングの新時代を迎えつつある中で、オープンソースの開発モデルは、高品質のソフトウェアを生産するための実行可能な戦略であり、オープンソースソフトウェアは、従来のプロプライエタリな開発モデルに比べて潜在的なセキュリティ上の利点を提供することができます。

翻訳協力 : 吉田行男

IRVING WLADAWSKY-BERGER

著者について

MITスローン経営大学院客員講師、MITデジタル経済イニシアティブ・フェロー、MITコネクション・サイエンス・フェロー。2007年5月、37年間勤めたIBMを退職し、主にイノベーションと技術戦略に従事。シティグループ、HBO、マスターカードのデジタル戦略アドバイザーを歴任。2005年から週刊ブログirvingwb.comを執筆し、ウォール・ストリート・ジャーナル紙CIOJournalのゲスト・コラムニストも務めた。シカゴ大学で物理学の修士号と博士号を取得。

About
Latest Posts

Linux Foundation Japan

Latest posts by Linux Foundation Japan (see all)