独占: AI のワールドプレミアをご覧ください

ブログ

ホームページホームページ / ブログ / 独占: AI のワールドプレミアをご覧ください

Jul 18, 2023

独占: AI のワールドプレミアをご覧ください

ESCLUSIVO: guarda la prima mondiale del cortometraggio generato dall'intelligenza artificiale "The Frost".

独占: AI が生成した短編映画「The Frost」のワールドプレミアをご覧ください。

ザ・フロストは、最初の数ショットでその不気味で当惑する雰囲気を釘付けにします。 広大な氷の山々、軍用テントの仮設キャンプ、火の周りに群がる人々、犬の吠え声。 それはよく知られたものですが、成長する恐怖の種を植え付けるのに十分奇妙です。 ここで何か問題があります。

「しっぽを渡して」と誰かが言います。 火のそばでピンクのジャーキーをかじる男性のクローズアップのカット。 グロテスクだ。 彼の唇の動きは完全に正しくありません。 ビートの間、彼は自分の凍った舌を噛んでいるかのように見えます。

AI 映画制作の不安な世界へようこそ。 「私たちは、写真の正確さへの欲求と戦うのをやめて、DALL-E の奇妙さに傾き始めたところにあるのです」と、The Frost を開発したデトロイトに本拠を置くビデオ作成会社 Waymark のスティーブン・パーカー氏は言います。

The Frost は 12 分間の映画で、すべてのショットが画像作成 AI によって生成されます。 これは、この奇妙な新しいジャンルのこれまでで最も印象的で奇妙な例の 1 つです。 MIT Technology Review が独占公開した以下の映画をご覧ください。

『ザ・フロスト』を製作するために、ウェイマークは、この映画を監督した会社のエグゼクティブ・プロデューサーであるジョシュ・ルービンが書いた脚本を受け取り、それを OpenAI の画像作成モデル DALL-E 2 に供給しました。モデルを作成するためにいくつかの試行錯誤の後、満足のいくスタイルで画像を作成するため、映画制作者は DALL-E 2 を使用してすべてのショットを生成しました。 次に、静止画像に動きを追加できる AI ツール D-ID を使用して、これらのショットをアニメーション化し、目をまばたきしたり、唇を動かしたりしました。

「私たちは、DALL-E が私たちに返してくれたものから世界を構築しました」とルービンは言います。 「奇妙な美学ですが、私たちは両手を広げて歓迎しました。それがこの映画の外観になりました。」

「これは確かに、スタイルが一貫していると感じられる、私が見た初めての生成 AI 映画です」と、独立系映画製作者であり、クリエイティブ テクノロジーを専門とするコンサルタント会社 Bell & Whistle の共同創設者である Souki Mehdaoui 氏は言います。 「静止画を生成し、それらを人形で動かすと、楽しいコラージュのような雰囲気が生まれます。」

The Frost は、過去数か月間にリリースされたさまざまな生成 AI ツールを使用して作成された一連の短編映画に加わります。 最高の生成ビデオ モデルでも、わずか数秒のビデオしか生成できません。 そのため、現在の映画作品は、『フロスト』のようなストーリーボードのような一連の静止画から、数秒間のさまざまなビデオ クリップのマッシュアップまで、幅広いスタイルとテクニックを示しています。

ビデオ制作用の AI ツールを開発する企業 Runway は、2 月と 3 月にニューヨークで AI 映画祭を主催しました。 ハイライトには、Laen Sanches による別世界の PLSTC が含まれます。これは、画像作成モデル Midjourney によって生成された、プラスチックに包まれた奇妙な海洋生物の目まぐるしいシーケンスです。 ジェイク・オルソンによる夢のような「ギヴン・アゲイン」は、2D 写真を 3D 仮想オブジェクトに変換する NeRF (神経放射フィールド) と呼ばれるテクノロジーを使用しています。 そして、サム・ロートンによる超現実的なノスタルジックな「Expanded Childhood」は、ロートンの古い家族写真のスライドショーであり、彼はDALL-E 2に境界線を超えて拡張させ、古い写真の半分覚えている細部をいじらせることができました。

ロートンさんはその画像を父親に見せ、「何かがおかしい。それが何なのか分からない。覚えていないだけなのか?」という反応を映画に記録している。

新しいテクノロジーを最初に実験するのはアーティストであることがよくあります。 しかし、ジェネレーティブ ビデオの当面の未来は、広告業界によって形作られています。 Waymark は、生成 AI を自社製品にどのように組み込むことができるかを調査するために The Frost を制作しました。 同社は、コマーシャルを迅速かつ安価に作成する方法を探している企業向けにビデオ作成ツールを作成しています。 Waymark は、Softcube や Vedia AI などの企業と並び、数回クリックするだけでクライアントにオーダーメイドのビデオ広告を提供するスタートアップ企業の 1 つです。

今年の初めに発表された Waymark の現在の技術は、大規模な言語モデル、画像認識、音声合成など、いくつかの異なる AI 技術を組み合わせて、その場でビデオ広告を生成します。 Waymark は、以前の顧客向けに作成された AI 以外のコマーシャルの大規模なデータ セットも利用しました。 「当社には何十万ものビデオがあります」と CEO の Alex Persky-Stern 氏は言います。 「私たちはそれらの最良のものを抽出し、優れたビデオがどのようなものであるかについてトレーニングしました。」

Waymark のツールは、月額 25 ドルからの段階的サブスクリプション サービスの一部として提供されており、ユーザーは会社名と所在地を入力するだけで利用できます。 このツールはまず、その企業の Web サイトとソーシャル メディアのアカウントのテキストと画像をスクレイピングします。 次に、そのデータを使用してコマーシャルを生成し、OpenAI の GPT-3 を使用して、ビジネスを強調する選択された画像上で合成音声によって読み上げられるスクリプトを作成します。

1 分間の洗練されたコマーシャルを数秒で生成できます。 ユーザーは必要に応じて、スクリプトの微調整、画像の編集、別の音声の選択など、結果を編集できます。 Waymark によれば、これまでに 10 万人以上がそのツールを使用したという。 (Waymark の AI 生成コマーシャルの 1 つをここで見ることができます。)

問題は、すべての企業がウェブサイトや画像を持っているわけではないことだ、とパーカー氏は言います。 「会計士やセラピストはまったく資産を持っていない可能性があります」と彼は言う。

Waymark の次のアイデアは、まだ画像やビデオを持っていない、または持っているものを使いたくない企業のために、生成 AI を使用して画像やビデオを作成することです。 「それが『The Frost』制作の原動力です」とパーカーは言う。 「世界と雰囲気を創造する。」

確かにフロストには雰囲気があります。 しかし、ジャンキーでもあります。 「それは決して完璧なメディアではありません」とルービン氏は言います。 「顔の感情的な反応など、ダル・イーから特定のことを理解するのは少し大変でした。でも、それが私たちを喜ばせることもありました。私たちはこう思いました。『なんてことだ、これは目の前で起こっている魔法だ』 」

この行き当たりばったりのプロセスは、テクノロジーが向上するにつれて改善されるでしょう。 Waymark が The Frost の制作に使用した DALL-E 2 は、ちょうど 1 年前にリリースされました。 短いクリップを生成するビデオ生成ツールが登場してからわずか数か月です。

このテクノロジーの最も革新的な点は、いつでも必要なときに新しいショットを生成できることです。「15 分間の試行錯誤で、シーケンスに完全に適合する希望のショットが得られます。」とルービン氏は言います。 彼はフィルムを切り取って、山腹のブーツのクローズアップなど、特定のショットが必要だったことを覚えています。 DALL-E なら、ただ電話をかけるだけで済みます。 「驚くべきことだ」と彼は言う。 「そのときから、映画製作者として本当に目を見張るような経験が始まりました。」

ロンドンを拠点に短編ビデオを制作するスタートアップ、プライベート・アイランドの共同創設者であるクリス・ボイル氏も、昨年の画像制作モデルの第一印象をこう振り返っている。すべてを変えてください。」

ボイルと彼のチームは、バド ライト、ナイキ、ウーバー、テリーズ チョコレートなどのさまざまな世界的ブランドのコマーシャルや、コール オブ デューティなどの大ヒット タイトルの短いゲーム内ビデオを制作してきました。

Private Island は数年前からポストプロダクションで AI ツールを使用してきましたが、パンデミック中にさらに強化しました。 「ロックダウン中、私たちはとても忙しかったですが、以前と同じように撮影することはできませんでした。そのため、その時点で機械学習にさらに傾倒し始めました」とボイル氏は言います。

同社は、NeRF を使用して 2D 画像から 3D シーンを作成したり、機械学習を使用してモーション キャプチャ データを最初から収集するのではなく既存の映像からリッピングしたりするなど、ポストプロダクションや視覚効果を容易にするさまざまなテクノロジーを採用しました。

しかし、生成 AI は新たなフロンティアです。 数か月前、Private Island は、Runway のビデオ作成モデル Gen-2 と Stability AI の画像作成モデル Stable Diffusion を使用して制作されたビールのパロディコマーシャルを Instagram アカウントに投稿しました。 それはゆっくりと燃え上がるバイラルヒットになりました。 「Synthetic Summer」と呼ばれるこのビデオには、屈託のない若者たちが太陽の光の下でくつろぎながらドリンクを飲む、典型的な裏庭パーティーのシーンが映されている。 これらの人々の多くは口の代わりにぽっかりと穴が開いていることを除いて、ビールを飲むと缶が頭に沈み込み、裏庭が燃え上がります。 ホラー番組ですよ。

「最初はそれを見ますが、それはただの非常に一般的で中途半端なアメリカーナものです」とボイルは言います。 「しかし、後脳か何かは、『ああ、彼らの顔はみんな逆向きだ』と考えているのです。」

「私たちは、メディア自体を使ってストーリーを伝えるのが好きです」と彼は言います。 「『Synthetic Summer』はその良い例だと思います。メディア自体がとても不気味だからです。これは、AI に対する私たちの恐怖の一部を視覚化したものです。」

これは映画製作の新たな時代の始まりなのでしょうか? 現在のツールのパレットは限られています。 フロストと「シンセティック サマー」はどちらも、それらを作成したテクノロジーの強みを活かしています。 The Frost は、DALL-E 2 の不気味な美学によく合っています。「Synthetic Summer」にはクイック カットが多数あります。これは、Gen-2 のようなビデオ生成ツールでは、一度に数秒しかビデオを生成せず、それらをつなぎ合わせる必要があるためです。 すべてが混沌としたパーティーシーンではそれがうまくいく、とボイル氏は言う。 プライベート アイランドでは、素早いカット割りが主題に適した武道映画の制作も検討しました。

これは、ミュージック ビデオやコマーシャルでジェネレーティブ ビデオが使用されるようになるということを意味するかもしれません。 しかし、それ以上のことは明らかではありません。 実験的なアーティストやいくつかのブランドを除けば、これを使用している人はまだ多くないとメダウイ氏は言います。

常に流動的な状態は、潜在的な顧客にとっても不快なものです。 「興味はあるようだが、テクノロジーの変化があまりにも速いため、プロジェクトにリソースを投入することに二の足を踏んでいる多くの企業と話をしました。」と彼女は言います。 ボイル氏は、多くの企業が、安定拡散などのモデルのトレーニングに使用されるデータセットにおける著作権で保護された画像の使用をめぐる現在進行中の訴訟にも警戒していると述べた。

これがどこへ向かうのかは誰にもわかりません、とメダウイ氏は言う。「現在、多くの仮定が、その背後にある微妙な考慮がまったくないまま、ダーツのように投げ込まれています。」

その間、映画制作者はこれらの新しいツールの実験を続けています。 メダウイさんは、友人のジェイク・オルセオンさんの作品に触発されて、生成 AI ツールを使用して、オピオイド使用障害の偏見を取り除くための短いドキュメンタリーを制作しています。

Waymark は The Frost の続編を計画していますが、DALL-E 2 では販売されていません。「どちらかというと『この空間を見てください』というようなものだと思います」と Persky-Stern 氏は言います。 「次にやるときは、おそらく新しい技術を使って、何ができるかを確認することになるでしょう。」

Private Island は他の映画でも実験を行っています。 今年の初めに、ChatGPT が作成したスクリプトと Stable Diffusion が作成した画像を使用したビデオを作成しました。 現在、Stable Diffusion がデザインした衣装を実写のパフォーマーが着用するハイブリッド映画の制作に取り組んでいます。

「私たちは美学にとても興味を持っています」とボイルは言い、それは絵文字とグリッチ効果に還元されたデジタル文化の支配的なイメージからの変化であると付け加えた。 「新しい美学がどこから生まれるのか、非常に楽しみです。生成 AI は私たちを映す割れた鏡のようなものです。」

「これらの生物が私たちよりも賢くなるのではないかということで、突然考え方を切り替えました。」

ヒントン氏は水曜日に EmTech Digital で講演します。

ChatGPT は汎用人工知能に関する憶測を引き起こしました。 しかし、AI の次の本当の段階は、特定のドメインとコンテキストで行われることになります。

EmTech Digital でヒントンが MIT Technology Review の AI 上級編集者である Will Douglas Heaven と話す様子をご覧ください。

特別オファー、トップ記事、今後のイベントなどをご覧ください。

メールを送信していただきありがとうございます。

何か問題があったようです。

設定を保存できません。 このページを更新して、もう一度更新してみてください。 このメッセージが引き続き表示される場合は、受信を希望するニュースレターのリストを添えて、[email protected] までご連絡ください。