絵を描いたり書いたりできるAIシステムを試してみました。 これが私が見つけたものです。

私にとって残念なことに、同じテクノロジーがいつか私を失業させるかもしれません。 人工知能システムは、書き込みもかなり上手になってきています。

これは、状況の文脈を理解し、聴衆に適したテキストを生成できるためです。 さらに、彼らは膨大な知識を使って、面白くてユーモラスな創造的なアイデアを思いつくことができます。

私が何を意味するか分かりますか? 最後の段落は、適切な散文を繰り出すことができるスマートフォンおよびデスクトップ ブラウザー用の無料アプリである ParagraphAI によって生成されました。 DALL-E を駆動するのと同じ人工知能ソフトウェア パッケージを使用し、ほぼ同じように機能します。 ParagraphAI に何について書きたいか (この場合は、AI プログラムが優れた散文を書く方法) を伝えると、テキストが表示されます。

ピューリッツァーに値するものではありませんが、早期の締め切りに間に合うには十分です.

DALL-E と ParagraphAI はどちらも、Tesla CEO によって 2015 年に設立された、サンフランシスコを拠点とする OpenAI によって開発された AI エンジンを搭載しています。 とりわけ、新しいTwitter所有者のElon Musk。

OpenAI は、AI を超越して「AGI」を実現するコンピューター システムの構築を目指しているため、マスクのロケット会社 SpaceX よりもさらに大きなムーンショットです。 それは人工的なものです 全般的 知能 ​​— 真に考えることができる機械。 それは実現にはほど遠いが、Musk と Microsoft の間で、OpenAI はこの問題に投じるために 20 億ドル以上を調達した。 そして、これまでに達成したことを見てください。

OpenAI は営利目的の研究機関であるため、彼らのおもちゃで遊ぶことができます。 同社は、誰でも DALL-E をある程度まで無料で使用できるようにしています。 新規ユーザーは、50 の無料の画像作成クレジットを取得します。 各クレジットを使用して、最大 4 つの新しい画像を生成できます。 その後、必要に応じてさらにクレジットを購入できます。 たとえば、115 クレジットの費用は 15 ドルです。

このレンブラント スタイルの肖像画は、画像を生成するための人工知能システムである DALL-E を使用して、数回のキーストロークで作成されました。 ハイアワサ・ブレイ

さらに、OpenAI は、外部企業がその AI ソフトウェアへのアクセスを購入し、一般に再販することを許可しています。 それがParagraphAIのビジネスモデルです。

マサチューセッツ工科大学のコンピューター サイエンスの大学院生である共同創設者の Kevin Frans は、次のように述べています。

トロントとケンブリッジを拠点とする ParagraphAI は、1 日あたり最大 20 個のテキストを生成できる無料バージョンを提供しています。 その後は、1 日あたり 150 回の使用に対して月額 $9.95 を支払うことができます。 同社は、忙しい人々が電子メールに返信したり、ビジネスレポートを書いたりするためのより簡単な方法として、このサービスを売り込んでいます.

しかし、結果のテキストが意味を成すという保証はありません。 シェイクスピアの「マクベス」でのフランク シナトラの演技について簡単なエッセイを求めたとき、ParagraphAI は次のように書いています。 シナトラは1948年の映画版で「身も凍るようで同情的」であり、「映画でのマクベスの最高の解釈の1つであると広く考えられている」.

もちろん、シナトラはマクベスの映画を作ったことはありません。 人間はチェックするのに十分な感覚を持っていたでしょうが、ParagraphAIは、スペルと文法は完璧ですが、完全に間違っている、もっともらしく聞こえるゴミをまとめただけです.

また、ParagraphAI に Musk の最近の Twitter 買収について書いてほしいと依頼したところ、奇妙な反応がありました。 「イーロン・マスクは 2013 年 4 月に Twitter を買収しました」とコンピューターは答えました。 「彼はソーシャル メディア プラットフォームに 2,600 万ドルを支払いました。」 Frans 氏は、アルゴリズムのトレーニングに使用されたデータは数年前のものであるため、ソフトウェアは現在の状況に対応していないと説明しました。 しかし、それはフェイクニュースをでっち上げた理由を説明していません。

ParagraphAI は、機械で生成されたテキストを使用する前に読むようにユーザーに警告し、それらが意味を成していること、および素材が他のオンライン ソースから誤って盗用されていないことを確認します。

DALL-E にも欠点があります。 顔は特に痛いところです。 それらはしばしば歪んでいて、不気味にさえ見えます. ただし、必要な画像の説明が詳細であればあるほど、より印象的な結果が得られます。

たとえば、「ボストンのスカイラインの雷雨」と入力すると、適切な画像が得られました。 しかし、「夕方、雷雨が押し寄せるボストンのスカイラインの不吉な 4K 画像」の方がはるかに優れていました。 DALL-E は、「不吉」や「陽気な」などの数十のトリガー ワードに反応します。 また、解像度を 4K に上げ、輝く日没の照明を提供しました。 そう言っただけだから。

これがどこに向かっているのかがわかります。 近いうちに、世界最高のアーティストは、DALL-E 用の最も巧妙で挑戦的なテキスト コマンドを思いつくことができるアーティストになるでしょう。 彼らは絵を描くことを学びません。 彼らはタイプすることを学びます。


Hiawatha Bray の連絡先は hiawatha.bray@globe.com です。 Twitterで彼をフォローしてください @GlobeTechLab.

Leave a Comment

Your email address will not be published. Required fields are marked *