アドビ・プレミアプロ。
今までちゃんと理解せず、なんとなく選んでいた「CUDA」ですが、
結果的にその選択で良かったです。
ただ、今のところ「インからアウトまで」などのレンダリングを必要としない環境のため、「ソフトウェア処理」にしようかとも思っています。
i7-10870HとGeForce RTX 2060なら4Kの編集は問題なし。( あえてインからアウトのレンダリングは必要なし )
Ryzen 5 3500UとCPU内蔵GPU Radeon Vega8 だと プレビュー動画がカクカク。( このPCでインからアウトまでのレンダリングを行ったらなめらかプレビューに )
GeForce RTX2060 から GTX 1650 LP にスペックダウンしたとしても4K編集でレンダリング無しで行けるかしら?
では、備忘録レビューをご覧ください。
目次でございます。
テスト環境。パソコンのスペックと動画の詳細。
パソコンのスペック
マウスコンピューター
DIVE ノートPC
CPU:
i7-10870H 8コア 16スレッド
ベース周波数 2.2 GHz
ターボブーストMAXテクノロジー 4.8 GHz
キャッシュ16 MB
バススピード 8 GT/s
TDP 45W
メモリ 32 MB ( DDR4-2933 )
CPU内蔵GPU
UHDグラフィックス
ベース周波数 350 MHz ( 0.35 GHz )
最大周波数 1.2 GHz
GPU (グラフィックボード)
NVIDIA Ge Force RTX 2060
VRAM 6GB
テスト動画
iPhone se2 で 4K 60フレームで撮影した44秒の動画。
動画編集ソフト
Premiere Pro バージョン 15.1.0
Premiere Proのレンダラーとは?
レンダリングとは
私もいろいろなサイトを見ているのですが、分かりやすいところがない。
これは私のわかりやすいであろう独自な考え方です。
原理や仕組みは置いておいて、
レンダリングは2段階(あると考えてください。)
レンダリング、1段階目
動画を切ったり貼ったり、文字を追加したり、エフェクトを掛けたりして動画編集を行いますが、「タイムラインエリア」の上にある「プレビュー画面」で編集具合を確認します。
プレビュー画面ではレンダリング処理されたデータが、プレビュー動画として「動いている」というわけです。
レンダリング1段階目は自動的に処理されています。
パソコンのスペックがある程度高い場合は、スムーズにプレビュー再生、プレビュー早送りなどができますが、
パソコンのスペックが追い付いていない場合、スムーズにプレビューすることが困難に。これではサクサク編集することができません。
レンダリング、2段階目
プレビュー画面がカクカクしている場合は、2段階目のレンダリングを手動で指定します。
2段階目は、編集動画の
- 「範囲を指定」して行うか、
- もしくは「最初から終わりまで全てを指定」して行うか
のどちらかを選びます。
2段階目のレンダリングを行うことで、カクカクだったプレビュー画面がスムーズになります。
イメージ的には「あらかじめ全体を読んでおいてスムーズに引き出せるようにしておく」みたいな感じでしょうか。
1段階目は、自動で処理されてプレビュー画面が見られるようになっている。しかしPCのスペックが低いとカクカクになる場合がある。
2段階目は、プレビュー動画がカクカクな場合に利用する。手動で指定しなきゃだめ。実行するとカクカクだったプレビュー画面がスムーズに。( ただしPCのスペックが本当に低い場合は改善できない )
必ずしも2段階目のレンダリングは必要ない。デメリットについて
例えばソース動画が500MBあったとします。これを2段階目のレンダリングを行うと別途300MBくらいのレンダリングファイルが生成されます。
元の動画が500MB、さらに300MBのレンダリングファイル。合計800MB・・・。
レンダリングファイルは、Adobe Premiere Pro Video Previews フォルダ にどんどん格納されていきますので、編集が終わって今後も再編集する見込みも無い場合は削除した方がいいです。無駄に容量を食い続けているのは不健全ですから。
逆に、
負荷の掛からない短い動画だったり、解像度がフルHD程度の動画を i7-10870H 8コア のような処理速度が速い部類のパソコンで編集するなら2段階目のレンダリングをせずとも編集可能です。
私は2段階目のレンダリング行わないまま、とある企業の「システム使い方動画」を作成してしまいました。再生時間は約60分と大きめのデータでしたが問題なく作れました。( ちなみに解像度はフルHDサイズでしたが )
タイムラインの上部には、
- 「黄色ライン」
- 「赤色ライン」
- 「緑色ライン」
が表示されています。スムーズなプレビューが可能かどうかの目安です。
黄色だと2段階目のレンダリングをしなくてもスムーズに再生ができる率が高い。
赤色だと逆で「負荷が重たいです。カクカクするかもしれません」という合図。
緑色が「2段階目のレンダリング済み」を表します。
よって、ずっと黄色ラインでかつ特にカクカクしないのであれば、無理に2段階目のレンダリングする必要が無いということです。
2段階目のレンダリングは、カクカクするなら利用しましょう。
最下部のおまけにて、低スペックのパソコンでカクカクしたという話をしています。
そこでは「黄色」なのにカクカクです。必ずしも黄色=大丈夫ということではないことを頭の片隅に覚えておきましょう。
レンダラーはOpenCLよりもCUDAの方が速く、OpenCLよりもソフトウェア処理の方が速い。
レンダリングの方法をレンダラーと呼びます。
CPUにGPUが内臓されている場合は2種類。さらに個別GPUが存在する場合は3種類あります。
私のパソコンでPremiere Proの「新規プロジェクト」を開くとレンダラーは3つ選べます。以下の通りです。
- ① MPE - GPU高速処理( CUDA )
- ② MPE - GPU高速処理( Open CL )
- ③ MPE - ソフトウェア処理
上の3種のどれが良いのか?ですが、レンダラーにGPUを当てはめると以下の通りになります。
- ① GPU高速処理( CUDA )(RTX2060でレンダ)
- ② GPU高速処理( Open CL )(内蔵GPUでレンダ)
- ③ ソフトウェア処理(CPUでレンダリング処理)
iPhone se2 で 4K 60フレームで撮影した44秒の動画をレンダリングした結果が以下の通りです。
レンダラー | CUDA RTX2060 | Open CL 内蔵 | ソフト処理 |
---|---|---|---|
レンダリング時間 | 50秒 | 2分48秒 | 1分50秒 |
稼働率 / CPU | 76% | 40% | 100% |
稼働率 / 内蔵GPU | 10~30% | 100% | 13% |
稼働率/ RTX2060 | 40~60% | 0% | 0% |
一番早いのはCUDA(RTX2060)でした。
次がソフトウェア処理、
一番遅かったのはOpen CL( CPU内蔵GPU )
よって同じような環境の人であれば、別途のグラフィックボードを利用するUCDAを選択する方が良いということに。
動画プレビューについて
稼働率云々は別にして、私のパソコン
- CPU i7-10870H 8コア
- メモリ32GB
- GeFroce RTX2060
で 4K P60 の動画をプレビューした場合、
レンダーがCUDAだと「フル画質」のプレビュー再生→たまに滑らかさがほんの少し足りない?と思うことがありますがおおむねスムーズで普通に再生できます。
レンダーがOpen CLとソフトウェア処理の場合、「フル画質」だと軽いカクカクです。60ページのパラパラ漫画が20ページくらいになった感じ。カクカクが止まるという最悪な展開にはならず動き続けますがちょっぴり違和感ですね。プレビュー画質を一段下げた「1/2」にすると問題なくスムーズです。
プレビュー再生はあくまでプレビューなので、書き出し後の動画品質にまったく関係ありません。よって編集作業も軽く動けるので無理に「フル画質」でプレビュー再生せず「1/2」で十分かと思います。
ちなみにメモリの消費量について。
私の環境では、レンダリング中は12GB~14GBを、レンダリング後のプレビューでは12GBを常時消費。
長ーいソース動画の場合や4K動画の場合は16GBだとギリギリかと思われます。24GB~32GBは欲しいところかと。
消費電力の観点からすると、ソフトウェア処理(CPU処理)が良い。
先ほども説明しましたが「新規プロジェクト」を開いたら、まずはレンダラー(処理方法)を3つから選ばなければなりません
選び終わってプロジェクト画面が開いた瞬間から、「プレビュー画面」は選択した方法で再生されます。
(レンダラーはプロジェクトの途中でも変更可能です)
レンダリングをする前のプレビュー稼働率と、
レンダリングした後のプレビュー稼働率は以下の通り。
消費電力が一番小さくて済むのはソフトウェア処理のようです。
レンダラー | CUDA RTX2060 前 | → 後 |
---|---|---|
CPU | 9% | 10% |
内蔵GPU | 25% | 0% |
RTX2060 | 6~30% | 23% |
レンダラー | Open CL 内蔵 前 | → 後 |
---|---|---|
CPU | 13% | 20% |
内蔵GPU | 24% | 34% |
RTX2060 | 13% | 14% |
レンダラー | ソフト処理 前 | → 後 |
---|---|---|
CPU | 10% | 10% |
内蔵GPU | 25% | 0% |
RTX2060 | 13% | 10% |
書き出し時間(エンコード時間)について
レンダリングはしていない状態で、上記の4K P60 570MB 44秒の動画を以下の6パターンで計測してみました。
レンダラーがソフトウェア処理で、
VBR2+ソフトウェアエンコーディング
VBR1+ソフトウェアエンコーディング
VBR1+ハードウェアエンコーディング
レンダラーがCUDA ( RTX2060 ) 処理で、
VBR2+ソフトウェアエンコーディング
VBR1+ソフトウェアエンコーディング
VBR1+ハードウェアエンコーディング
ビットレートエンコーディングの設定で、
- サクッと終わらせる VBR1
- じっくり調べてから終わらせるVBR2
があります。高品質を求めるなら時間が掛かりますがVBR2にしましょう。
(ただし、VBR1とVBR2を比べても違いは私にはわからなかった。動きの速い動画であればVER2にするべきらしい。)
で、VBR2に設定すると「ハードウェアエンコーディング」ができなくなります。VBR2は「ソフトウェアエンコーディング」のみ選択できます。
エンコードの設定で、
- ソフトウェアエンコーディング
- ハードウェアエンコーディング
の2つがあります。
ソフトウェアエンコーディングは、時間が掛かるけどきれい。
ハードウェアエンコーディングは、サクッと処理できるけどそれなり。
時間が無い人はハードウェアで、時間がある人はソフトウェアでお茶でも飲みながらじっくり待つというのが選択の分かれ目。
(ただ、そんなに見た目に差がないと思うのです。実際にエンコード後の動画を見比べたのですが・・・。よって普段からサクッと終わるハードウェアの方が良いのでは?と思います。)
( ターゲットビットレートが高けりゃ関係ないのでは?という疑問も残りますし。)
書き出し設定は以下の通り。
- H.264
- 高品質2160 4K
- ソースに合わせる
- 最大深度ON
- ターゲットビットレート80MB
- 最大ビットレート96MB
レンダラー | CUDA | CUDA | CUDA |
---|---|---|---|
形式 | H.264 | H.264 | H.264 |
プリセット | 高品質2160 4K | 高品質2160 4K | 高品質2160 4K |
最大深度 | ON | ON | ON |
ソースに合わせる | ON | ON | ON |
VBR | VBR2パス | VBR1パス | VBR1パス |
エンコーディング | ソフトウェア | ソフトウェア | ハードウェア |
エンコード時間 | 6分35秒 | 3分7秒 | 39秒 |
稼働率CPU | 70-80% | 70-80% | 13% |
メモリ | 13.3 | 13.6 | 14 |
内蔵GPU | 60-70% | 7% | 38% |
RTX2060 | 45-86% | 50-78% | 80-90% |
レンダラー | ソフトウェア処理 | ソフトウェア処理 | ソフトウェア処理 |
---|---|---|---|
形式 | H.264 | H.264 | H.264 |
プリセット | 高品質2160 4K | 高品質2160 4K | 高品質2160 4K |
最大深度 | ON | ON | ON |
ソースに合わせる | ON | ON | ON |
VBR | VBR2 | VBR1 | VBR1 |
エンコーディング | ソフトウェア | ソフトウェア | ハードウェア |
エンコード時間 | 6分26秒 | 2分50秒 | 35秒 |
稼働率CPU | 70-80% | 70-80% | 16% |
メモリ | 13.8 | 13.4 | 15 |
内蔵GPU | 6% | 8% | 45% |
RTX2060 | 50-80% | 0% | 90% |
エンコード速度の結果としては、
まずレンダラー種類は関係ないことがわかりました。UCDAもソフトウェア処理もほぼ同タイム。
で、きれいに書き出すから時間が掛かるソフトウェアエンコーディングと、ビットレートをじっくり調べるから時間が掛かるVBR2の組み合わせがやっぱり一番遅いです。元が44秒で書き出しが6分26~35秒。およそ9倍の時間が掛かりました。30分の4K動画なら4時間30分?
で、きれいに書き出すから時間が掛かるソフトウェアエンコーディングと、ビットレートをさらりと調べるVBR1の組み合わせが真ん中のタイム。元が44秒で書き出しが2分50秒~3分7秒。およそ4倍の時間。30分の4K動画なら2時間?
最後が、そこそこに書き出すハードウェアエンコーディングと、VBR1の組み合わせ。元が44秒で書き出しが35~39秒の好タイム。30分の4K動画なら26分で書き出しが完了しちゃいます。
個人的に扱う動画なら、
ターゲットビットレートを上げていれば、ハードウェアエンコーディングで良いじゃないの、と思っちゃう。ハードECとソフトECの画質の劣化の差については判断できませんでしたから。
ただ気になる点は「個別のGPUに頼っている」という点。
私の場合はGeForce RTX 2060 というグラフィックボードが働いています。VRAMは6GB。グラボの比較サイトでは「4Kの動画編集がストレスなく行える最低スペック」がRTX2060です。
これがもし50%性能ダウンの GeForce GTX 1650 4GBの場合だと、35~39秒のタイムが1.5倍伸びますがそれでもエンコードは速い。
しかしエンコードは良いですが、動画プレビュー再生のカクつきについては「フル画質」だとカクツキ、「1/2」で問題なくスムーズになると予想。
RTX2060のコア数は1920に対して、GTX1650のコア数は890ですから4K P60 の「フル画質」プレビューはさすがにカクつくのではないだろうか・・・?
そうそう、書き出し画面には下部に「プレビューを使用する」というチェックボックスが存在します。これは「レンダリングファイル」を利用することによって書き出し速度をスピードアップできる機能らしいのですが、
i7-10870Hの環境で、レンダリングを行い、レンダラーをUCDA・ソフトウェア処理、エンコードをソフト・ハードの全組み合わせで試してみたのですが、スピードアップはしていませんでした。チェックを入れていない状態とほぼ同タイム。
それは、次の項に登場する「低スペックパソコン」で試してみても同じ。「プレビューを使用する」って何のために存在するのだろう?という疑問が残りました(笑)
おまけ。AMD Ryzen 5 3500U はカクカクしました。
サブPCとして、HP製のノートパソコン14s-dk0101AUを持っています。
こちらは2019年1月に販売された低スペックパソコン。
CPUはAMDのRyzen 5 3500U で、4コア 2.1GHz メモリは16GB
ちなみにCPUスコアは7700、
i7-10870Hだと15,000(笑)
個別のグラフィックボードなどもちろんありません。
CPU内蔵GPUのRadeon Vega 8 1200MHz VRAM2GB がグラフィックボードの代わりです。
で、先ほどの4K p60 450MB 44秒のデータを入れてみたところ、
見事にプレビュー画面がカクカクです(笑)
レンダラーについては、個別のグラボが無いのでCUDAはありません。あるのはOpen CLとソフトウェア処理の2つですがその双方でカクカク。
フル画質・1/2・1/4・1/8のすべてでカクカクの10秒後に映像は止まります(笑)
書き出ししてみました。
4Kサイズで、ビットレート80MB、VBR1で書き出し。
個別のグラボが無いので当然ハードウェアエンコーディングは選べません(涙)
Open CLでは、
書き出しに9分10秒かかりました。
ソフトウェア処理だと、
7分38秒でした。
で、
せっかくカクカクしていたので2段階目のレンダリングを実行してみたところ・・・、
見事に、スムーズにプレビューされるようになりました!!!
キツネにつままれた様な衝撃です。本当にスムーズになっとる。すごい。
レンダリングに掛かった時間はOpen CLで4分30秒。約5分待てばサクサク編集できるとは恐れ入りました。
※ レンダリングファイルが生成されたあと、
- Open CL 処理
- ソフトウェア処理
のそれぞれでプレビュー再生を「フル画質」で試してみたところ、
- Open CL 処理だとスムーズ
- ソフトウェア処理だとちょいカク。( 画質を「1/2」にしたらスムーズ )
という結果に。
CPU内蔵GPUと言えでも、「GPU」の力強さが垣間見れました。見直したぞOpen CL。
で、レンダリング後、プレビュー再生している間の稼働率は、
- CPU:22%、
- 内蔵GPU:12%
消費電力はレンダリング後のプレビュー再生の方が小さい。
ただ、
やはり元から高性能なパソコンがあればレンダリングは必要ないというのが証明されました(笑)
ただし、レンダリングするとその後の編集の際のプレビューの電力消費が小さいという特典が・・・。うーむ。レンダリングした方が作業の効率は上がるし、環境にも電気代にも優しいということか。
まとめ。別途グラボもしくはCPUに良いものを使っているなら、CUDAかソフトウェア処理を使いましょう。
レンダラーについて
レンダラーについては、
① プレビュー再生のスムーズさ
- パソコンにGeFoece の GTX1050 以上 のグラフィックボードが付いている場合はCUDA。
- 8コア以上のCPUが搭載されている場合は、プレビュー動画はスムーズなのでソフトウェア処理でも可。
- 別途グラフィックボードが付いていないパソコンで、CPUにGPUが内臓されている場合は、Open CL。
- CPUのスペックが低く、かつ別途グラフィックボードも付いていないならソフトウェア処理。
よってレンダラーの選択については、私の環境ではソフトウェア処理でも良いということに。一般にはソフトウェア処理かCUDAですね。
② レンダリング
- CUDA :50秒
- ソフトウェア処理:1分50秒
- Open CL :2分48秒
レンダリング処理時間については、CUDAをレンダラーに選択した場合が1番速かった。グラフィックボード強し。
エンコードについて
書き出しエンコードについては、
VBRの設定は、1で良いかと。画質については素人目にはわからないので。
- VBR1:処理時間は速い・画質が荒い
- VBR2:処理時間は遅いが・画質が良い
「ターゲットビットレート」と「最大ビットレート」は、キレイに処理するならは60MB以上にしたい。
80~90MBの場合だと、39秒で書き出されたファイルは元が450MBに対して420MBくらいですが、
60MBだと、32秒で書き出され、かつ325MBにまで削減されます。その動画ですがあからさまなブロックノイズなどもなく映像としてはキレイに見えますよ。
エンコード処理には、グラボが装着されているなら以下2パターン選べます。グラボが付いていないならソフトウェア・エンコーディングのみ。
- ハードウェア・エンコーディング( 別途グラボ装着パソコン )
- ソフトウェア・エンコーディング( 内蔵GPUもしくはグラボ無しパソコン )
がありますが、
ハードウェア・エンコーディングが爆速です。
- ハードウェアEn : 35秒
- ソフトウェアEn : 2分50秒
ハードウェア・エンコーディングは、グラフィックボードの性能の一つ「コア数」が多ければ多いほどエンコード処理時間が短くなります。
RTX 2080 Ti : 4,352 個 150,000 円
RTX 2080 : 2,944 個 100,000円
RTX 2070 : 2,304 個 80,000円
RTX 2060 : 1,920 個 60,000円
GTX 1660 : 1,408 個 50,000円
GTX 1650 : 896 個 30,000円
GTX 1050 : 640 個 20,000円
ソフトウェア・エンコーディングの場合は、
ハードウェア・エンコードの2~5倍以上の時間が掛かってしまいます。
また、CPUパワーが処理時間に直結します。
以下は8コアCPUと4コアCPUのソフトエンコーディング時間。
i7-10870H 8コア : 2分50秒( ソフトウェア処理 )
i7-10870H 8コア : 3分10秒( Open CL )
Ryzen 3500U 4コア: 7分38秒( ソフトウェア処理 )
Ryzen 3500U 4コア: 9分10秒( Open CL )
CPUが8コアで、グラボがRTX2060の場合、
レンダラーにCUDAを選択してハードウェア・エンコーディングした場合でも、
レンダラーにソフトウェア処理(8コアCPU)を選択してハードウェア・エンコーディングした場合でも、
どちらの場合もエンコード時間にほとんど差はありませんでした。どちらを選んでもOK。
ただし、低スペックパソコンの場合、
レンダラーにOpen CLを選択してソフトウェア・エンコーディングした場合と、
レンダラーにソフトウェア処理(8コアCPU)を選択してソフトウェア・エンコーディングした場合だと、
差が大きくなる傾向にあるようです。
7分38秒と9分10秒。ソフトウェア処理の方が速い。内蔵GPUは遅い。
処理時間の遅い・速いだけではなく、
ハードウェア・エンコーディングは、画質が荒い
ソフトウェア・エンコーディングは、画質が良い
と言われていますが、これも「VBRの1と2」と同じように素人目にはあまりわかりません。
よって、処理時間が短いハードウェア・エンコーディングで良いかと思います。
余談( エンコード関係ない話 )
備忘録。
2020年1月から始まったチャイナバイオハザード「武漢ウィルス」
日本では、毎日1,000人単位で新規感染者が報告されていましたが( 反日テレビメディアしかいない今のテレビ局の報道なのでウソかもしれませんが )
現在、2021年の10月でなんとか100人を下回るようになったとか。( ロシアではロックダウン開始ってなにやってたんだロシア )
今までリモートの在宅勤務が流行ったせいで「高性能パソコン」に注目が。
特に、数年前より登場したビットコインをはじめとした「仮想通貨」の「マイニング」とやらで
性能の良い「グラフィックボード」が重宝され、
世界的に「グラフィックボード」の枯渇状態が続いています。
売っていたとしても通常の販売価格よりも高いこともしばしば。
世の中、どうなっているのでしょうかね。うーむ。
¥ 62,800
RTX2060と言っても、親メーカーのNVIDIAから販売されているRTX2060もあれば、サードパーティー製のRTX2060もあります。こちらはサードパーティーのMSIがライセンス契約して製造しているRTX2060になります。
コア数:1920個、VRAMは6GBという性能は、4Kをレンダリング無しで編集できる性能です。( これ以下の性能のグラボであれば「レンダリング」をした上で、プレビュー画質を「1/2」にすれば4K編集可能。ただ1920個のコアだと書き出しエンコードがバリバリ速い。エンコード時間をサクと終わらせたいという人は最低でもRTX2060クラスを導入したいところです。 )
ロープロファイルモデルは無いのでスリムパソコンには搭載できません。通常のタワー型パソコン用です。
¥ 32,000
玄人志向(くろうとしこう)というサードパーティが製造したGTX1650_VRAM4GB。GTX1650は補助電源はありません。よってパワーは控えめ。
RTX2060のコア数:1920個に比較して、コア:896個。性能の単純比較では50%ダウンモデルということに。
ただ、レンダリングを行って画質を1/2でプレビュー表示させれば4K動画の編集は可能です。(私の低スペックパソコンの内臓GPUのVRAMはたったの2GBで、レンダリング&画質1/2で4Kプレビューできましたから。)
¥ 38,000
MSI社が作るGTX1650です。上の玄人志向のGTX1650との違いは、通常のタワー型だけではなく「スリムPC」にも接続可能なロープロファイル仕様(グラボの横幅がスリムになったバージョン)という違いです。他の性能は一緒。
¥ 23,800
玄人志向のGTX1050Ti。4GB。型番の後ろに「Ti」が付いたモデルはちょっぴり高性能モデルです。
コア数:640個は、おそらく「レンダリング」して「画質1/2プレビュー」で4K編集ができる最低スペックギリギリとなるはず。4Kの下のフルHD動画であれば問題なくサクサクです。
¥ 24,800
MSIのロープロファイルに対応したGTX1050 Ti になります。