重要なスキルのレイヤ(層)が上がるということ

DTM (デスクトップミュージック)ソフトであるAbleton Liveが、Googleの音楽生成AIライブラリ Magentaを用いたツール Magenta Studioとつながったというので、早速ためしてみた。ものの15分ちょっとで作ったのが、下の超ショートビデオだ。「他の誰かが同じものを作ることはできなかった」という意味で、「音楽も映像も、僕がつくったオリジナルビデオ」と言って良い気がする。「気がする」というのがどういう意味かは後述しようと思う。


自動作曲を利用して制作した音楽と、フリー写真を組み合わせて制作したオリジナルビデオ


まずは、制作するに当たって何をしたかを書いておく。手順としては下記の通りだ。ポイントがわかりやすくするため、なるべく一般用語で書き、末尾に実際に使ったツール名を追記する。それぞれのプロセスが、数分の作業である。


  1. 楽曲制作ツールで、組み合わせる楽器を適当に選ぶ。ここでは、3つの楽器を合わせることとし、ピアノ、ベース、ドラムを選んだ。ただし実際には、もう少し細かく楽器の種類を選んでいる(Ableton Live)
  2. 3つのトラックそれぞれの音を、AI作曲ツールで自動生成した。その際、つくる小節数および、音のばらつき度合いを設定した。任意個数の曲を生成できるのでトラックごとに10個程度生成し、それぞれのトラックで、一番良さそうなものを選んだ。(Google Magenta Studio)
  3. ピアノとベースは、それぞれ自動作曲したものの調が合っていなかったので、マッチするように、ベースの音を移調した。タイミングも、3つの楽器が適度にマッチして聴こえるように、タイミングを調整した。完成した曲を、mp3フォーマットで出力した。(Ableton Live)
  4. 適当なサイトで、フリーで使える写真を探し、music, computer, piano等のキーワードをいろいろ入れてみて、出てきた写真の中から、なんとなく楽曲のイメージに合うものをピックアップしたテンポよく写真が入れ替わるのが良い気がしたので、サウンドは10秒弱しかないが、写真は5つ選んだ。(サイトは pixabay
  5. 動画編集ツールで、まずサウンドのトラックにmp3フォーマットの楽曲を入れ、適当なタイミングで写真が切り替わるように設定した。切り替わりのタイミングと順序が、なんとなくサウンドの印象と合うようにした。(Adobe Premiere Pro)



さて、前述のように、冒頭のビデオは、素材としてはAIによる自動作曲と、フリーの写真素材だけを使っているのだが、僕が自分の感覚だけを頼りに進めた部分に下線を引いている。「なんとなく」とか「適当に」という部分が多いことがわかるだろう。あとは、DTMというよりは音楽に関するノウハウがある程度要求される部分がある。結果の良しあしは別として、僕が「音楽も映像も僕がつくったオリジナルビデオという気がする」というのは、その下線部分が理由である。見てわかる通り、すべて一瞬の作業なのだが、その時々で一応ちゃんと判断をしているので、センスには一貫性が保たれているはずである。それはたぶん、とてもセンスの良い人から見ればダサく見えるだろうし、音楽も映像も、日常はあまり意識せずに接している人から見れば、「なんとなく良さそうな気もする」と思えるかも知れない。


さて、このプロセスを見たとき、結果として良いものを作るのに必要なスキルは何だろう? まず、音楽に関する基本的な知識は、ある程度必要だ。たとえばピアノとベースとドラムの3トラックがあればなんとかなるだろうとかいうこととか、楽器同士がマッチして聴こえるためには調性をうまく合わせる必要がある、という話だ。そして、それさえあれば、それが映像作家であれミュージシャンであれ俳優であれ、そして陶芸作家であれ書家であれ、その分野で素晴らしいアーティストであれば、僕よりもはるかに素晴らしいものをつくる気がする。そして、(そういう人はあまりいないかも知れないが)映像編集ツールの使い方は詳しいけれどあまり音楽を聴かない人とか、ピアノを弾くのはうまいけれどもミュージックビデオはあまり見たことがない人とかは、申し訳ないけれども、僕よりもさらにダサいものを作るかも知れない。要するに、すぐれた映像作品を作るのに必要な能力は、ますます、道具をうまく使えるとかよりも、音楽や映像に関するある程度の教養であったり、抽象的な意味でのアーティスティックなセンスに移っていくだろう、ということである。逆に、別にそういうセンスがなくても、「そこそこのレベルのこと(あるいは、もの)」ならば、別にDTMや映像編集の経験などほとんどなくても、簡単にできるようになる。言いかえると、いろいろなことにおいて、重要なスキルが上位レイヤ(プロセスの中で、より抽象的な部分)に移っていく可能性がある、ということだ。


実はこれは、ミクロな個人スキルのレベルではなく、マクロな産業レベルでは、ずっと前から起きていたことだ。たとえばインターネットの世界でも、そのすべてを支えていて、これがなければ世の中が止まってしまう通信インフラ、ネットワーク管理などのレイヤの業種があまり儲からなくなり、そのレイヤ上でコンテンツを提供し、あるいはコンテンツも自前では持たずに検索や広告機能を提供する企業に、利益は集中するようになっている。いわゆるOTT (Over the top)と呼ばれる産業であり、これが良いとか悪いとかを論じる気はないけれど、世の中の現象として起きているのは明らかだ。そういう意味で、僕が言っているのは、個人で必要とされるスキルのOTT化と言っても良い。


ちょっと自動作曲で遊んでみただけにしては大げさだけれど、僕が最近問題意識として持っている、「テクノロジーが急速に高度化する時代に重要なスキルは何か」という観点で言えば、こんなちょっとした体験からも、「重要なスキルは、確実に上位レイヤに移っていくな」という気がした。


P.S. 実は上記では、このような意味での上位レイヤとは別に、たとえば自動作曲ツールをつくるための高度なAI(ディープラーニング)技術などの、もっとも基礎的な部分のトップスキルもさらに重要になるという話に触れていないのだが、これはいずれ、産業でいうところのスマイルカーブの話と関連づけて書きたい。


Ableton Live と Magenta Studioによる編集画面

T. Kamba (神場知成)

人間・機械融合系コミュニケーションシステムのデザインに興味を持つ。コンピュータ・サイエンス分野で、メーカー系研究所の研究員を経て、現在は東洋大学 情報連携学部 教授。専門はユーザ・エクスペリエンス・デザインなど。 趣味は音楽全般。特に自分でも演奏するピアノを中心にジャズ、クラシック。ジャズはミシェル・ペトルチアーニ、ビル・エヴァンス等。クラシックはバッハ、フィリップ・グラス、ブラームス、グレン・グールドなど。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です