番外-6-1.貧弱CPU搭載PCを使って体感速度の謎を考えるの巻①
★★★★★★★★★★★★★★★★★★★★★★★★
★★★★★★★★★★★★★★★★★★★★★★★★
☆☆☆☆ 注意 ☆☆☆☆
番外は雑談コーナーです。
本編読みたい人は飛ばしてください。
1章から読むと、スローライフからはじまります。
”富士の樹海より、もっと良い森”です。
未来の世界から、娘を名乗る死神さんに呼びに来て欲しい人は、こちらから読んでも良いと思います。
↓
21章.横浜編1 50の年の同窓会
1章から読んで、展開が遅すぎると感じる人は9章から読んで、後から1~8章を回想として読んでも話は繋がります。
21章から読んでも、1章に戻るポイントがありますので、どちらから読んでも問題ありません。
1章、或いは21章から読み始めてください。
★★★★★★★★★★★★★★★★★★★★★★★★
★★★★★★★★★★★★★★★★★★★★★★★★
唐突ですが、PCの話です。
私は非力なPCも好きで結構使います。
無駄に電力消費して遅いやつではなく、消費電力も処理能力も低いやつです。
スモールコアという呼び方もします。元々Atomという名で登場したシリーズの進化系です。
インテルのラージコア系のCore iシリーズは、長らく足踏み状態で、ほとんど速度が上がらない時代がありました。
そんな時期にも、スモールコアは少しずつ高速化していたので、相対的にお得感が上がっていました。
Celeronブランドに格上げされたN3450(Apollo Lake)以降は、とりあえず使えるくらいの速度があり、さらに、Core iが殆ど高速化しない割に、スモールコアは毎年高速化するので速度差が年々縮まっていたのは確かだと思います。
と言っても、ラージコアとの速度差はかなり大きかったです。
ところが、Core iより速いと言っている人が結構居ました。
たぶんそれはベンチマークの数字だけ見てるか、CPU 以外の速度差ではないか?と思うのです。
CPU 以外の……というのは、例えばストレージにHDDとSSDの差があるPCを比較してたり。
SSD搭載のスモールコア機とHDDのラージコア機を比較すれば、スモールコア機の方が速く感じるかもしれませんが、ラージコア機のHDDをSSDに交換すればスモールコア機より速くなる可能性が高い。
或いはメモリ4GBのラージコア機と8GBのスモールコア機の比較をしているのであれば、メモリ容量を揃える。
ストレージやメモリ容量で速度差が出ているのはCPUと関係ありません。
(初期のCore iの時代はSSDは普及していませんし、Windows10も存在していません。
そんな時代の品ですから、CPU以外の部分でも、部品が非常に古いです)
CPU以外で発生する速度差もあるので、詳しくない人は
”CPU以外が原因なのにCPUだけ見て、速いと言っている可能性もありそうだ”
と思うのと共に、ベンチマークでも、数字だけで見るとスモールコア機は、CPU の項目の数字が高く出ることはあります。
ベンチマークのCPUの項目だけ見て、Celeron Nxxxxは第いくつ世代のCore iと同等の速度……とか言ってるのは、凄い嘘だと思います。
単に、ベンチマークのCPUの数字が同レベルだというだけで、体感速度とあんまり関係ないです。
(Intel Processor N(Alder Lake N(N100/N95))世代は、数字だけでなく実際に速いです。
ただし、TDPの方が嘘になっています(古いCPUのTDPは比較的スペックとの乖離が少ないので))
『いまどきのCPUは、普段使いには十分な速度があるから、比較する必要が無い』と言うのであれば、そもそもベンチマークとか第何世代のCore iより速いとか言い出す必要がありませんし、実際のところ、普段使いでも速度差はけっこうあります。
WindowsUpdateがいつまでも終わらないとか、マウス操作に対してスクロールバーが後から追いかけてくるとか、スクロールしている最中、真っ白画面になってる時間が長いとか、ゆっくり操作しないと操作に反応しないとか、期待した動作と異なる動作をするなど、致命的とまでは言いませんが、操作性に明らかな差がある。
GUIの反応速度は、GPU性能の影響も大きいわけですが、内蔵GPUの速度差も含めて、通常のGUI操作で余裕で体感可能なレベルで速度差が存在しています。
”十分速い”と言ったときの”十分”は使う人が決めることなので、「十分使える速度がある」という話に対して文句を言うつもりは無いです。
私自身実際に使ってますし、昔のデスクトップ機と比べると恐らく消費電力的には圧倒的に有利だと思いますので、特に省電力化を進めたいという用途では効果が大きいと思います。
ただ、PASSMARK等のベンチマークのスコアで比較すると数字の割に遅いと思います。
Core iとはかなりの速度差を感じます。数字と体感速度の差が3倍あったり。
実測しても、体感速度と同様に大きな差が出ます。
GPU性能の問題もあって、私の場合は、twitterのRT不発で不便を感じることが多いです。
デスクトップPCで日頃から普通にやってる操作でN,Jシリーズだと無反応くらいの差があります。
同じ操作でも、ある程度速い機種ではRT完了。少し遅い機種だとRTメニューが開いた状態になる。
もっと遅いと無反応。(GPUも含めて)おそらく5倍くらいの速度差で無反応が出ると思います。
N,J系だと無反応が多いです。Core iだと無反応は少ないです。
(正確な操作は、”いいね”を押した後”RT”をダブルクリックです)
操作に追従する程度の速度があれば、体感速度は飽和してしまいますが、そういうレベルの速度ではないです。
遅いとダメなんてことは無く、人間の方が、遅さに合わせて、少しゆっくり操作すれば済むだけなので、致命的ではないです。
『好きなの使えよ』の世界なのですが、第x世代のcore ix-xxxxと同等の速と言う割に、実際比べると全く違う……となると問題があるように感じます。
同等の速さと言われてるやつを横に並べて比較すると2倍くらい速度差があります。
(Core iシリーズで数値的に下位に来るのは2コア品なのですが、
2コア品と4コア品を比較してしまうと差が派手に出ます。
4コア品同士の比較であれば1.5倍差くらいで済みます)
ある程度上位のCPUでは、普段使いの体感速度なんて飽和するので、比べる意味があまりありませんが、Celeron Nxxxx/Jxxxxは比べる意味がある程度には遅いです。
また、たまにしか使わない人はCeleron機で十分なんて話もありますが、個人的にはそうでも無いような気がしています。
コスト優先なら仕方ありませんが、そうでないなら、たまにしか使わない人こそ、Celeron機は避けた方が良いかもしれません。
たまに起動すると、使う時を狙ってWindowsUpdateが走って、作業を妨害されることになりますので、個人的には、むしろ、不便が際立つように思います。
そこそこのPCでは、WindowsUpdateが走っても気付かずに使ってられることも多いのですが、元から非力なPCでWindowsUpdateが走ると、操作性の悪化が激しいです。
なので、非力PCを好んで使う人はPCを何台も持っていて、WindowsUpdate中も、他のPCが使えるような環境にしているのではないかと思います。
--------
私は非力なPCもけっこう好きです。
”大昔の発熱して遅いPC”のことではなく、元から処理能力より省電力を狙って作られたシリーズです。
スモールコア、今ではEコアと呼ばれるようになりつつあります。
Atomブランドだったころはともかく、Celeronブランドに使われるようになってからは、ほどほど使えます。
少なくともTDP6~12WになったApollo Lake世代以降は、けっこうまともに使えます。
ある程度使える性能を持ちつつ、消費電力が低く、熱風を噴出しないという点ではなかなかバランスの良いCPUだと思います。
このあたりのCPUですね。
少しずつ高速化していますが、Jasper Lakeの時点ではCore iと勝負できるような速度は無いように感じます。
↓
CPU開発コード 代表例
Apollo Lake N3450(TDP6W),J3455(TDP10W)
Gemini Lake N4100(TDP6W),J4105(TDP10W)
Gemini Lake Refresh N4120(TDP6W),J4125(TDP10W)
Jasper Lake N5100(TDP6W),N5105(TDP10W),N5095(15W)
(実際はN5100(PL1=6W、PL2=20W)は最大7Wくらいで、
最大17WのJ4125(PL1=10W、PL2=25W)と近い速度が出ます。
N5095(PL1=20W、PL2=28W)は最大13W程度でN5100(PL1=6W、PL2=20W)
に対して消費電力が2倍近いわりに25%くらい速いという感じです。
電力効率的にはイマイチですが、それでも割と電力効率良いです)
--------
Alder Lake-Nは非力系卒業扱いにします。
===================================================================
atom時代からN5xxxまでの話です。
(最新のN100は、TDP設定次第ではありますが”古いCore iより速い”がけっこう成立します)。
世代とともに高速化しているので、長年停滞が続いたCore iシリーズの古いやつとの差は縮まっているのは確かだと思いますが、大差があるころから○○より速いと言われていて、すごい違和感がありました。
このあたりのCPUですが、コア数が多いので、ベンチマークでは高めの数字が出やすいです。
実際に使って数字に比例して速いかというと、同じ系統のN、Jシリーズとはある程度比例しそうですが、Core iとは素直に数字に比例しないと思います。
特に4コアのN、Jシリーズと2コアのCore iを比較すると、数字とかけ離れた結果になりやすいです。
N、Jシリーズの方がベンチマークのスコアが1.5倍なのに、体感速度は0.5倍とかそんな感じです。
体感速度とスコアがかけ離れているので、近い数字のCPUと並べて同等だと言ってしまうと、現実の体感速度では大差が出てしまいます。
下の方で触れますが、画面描画速度にも大差が有って、実際の体感速度は、触れば瞬時に気付くくらいの大差が有ります。
それとも、この速度差が体感できないほど鈍感な人が多いのでしょうか?
普通にスクロール操作すれば遅さを感じると思います。
このように簡単に真っ白画面になってしまいます。
簡単にGPU負荷が100%を超えてしまうのです。
(わざわざスクロールしまくっている間に真っ白画面になるからと言って、それ自体に問題は無いです。
これが画面描画速度が遅い証拠になります。
その遅さが画面描画全般に効いてくるので、遅さのわかりやすい目安になるだけです)
個人的には、普通に操作すると付いてこないので、少し待つ必要があるように感じることがあります。
i3-5005U(2コア4スレ、最高2.0GHz)が、だいたいJ4125の2倍速いくらい速く感じます。
i5-5257U(2コア4スレ、最高3.1GHz(のパワーダウン設定))になると、3倍速く感じます。
4コア機になると第3世代のi5 3470(4コア4スレ、最高3.6GHz)でもかなり速いです。
なので私はベンチマークのCPUの数字見てN、Jシリーズが第何世代のCore-iより速いというのは嘘っぽく感じます。
第2世代機でもCore-iはかなり速いのです。
実際に試しても数字に出る差です。
世の中には色々ベンチマークはありますが、軽作業での体感速度と比例するような指標はあまり無いように感じます。
2万円のミニPCの速度比較するのに、3Dゲームやビデオ編集の時間見てもあんまり意味が無いように思うのです。3Dゲームやビデオ編集用途でわざわざこのクラス選びません。
まず最優先は、軽作業で、どの程度快適に使えるかです。
全く無意味とは言いませんが、もうちょっと普通に使うような範囲の動作を重点的に調べた方が良いです。
WindowsGUI全般の速度など、誰もが使うような部分を比較した方が良いと思うのです。
軽作業でもゆっくりのPCで見るべきは、軽作業での体感速度に近いテストです。
LibreOfficeというアプリで、400MBのxlsxファイルをUSBメモリから開く時間を測りました。
なろうAPIで取得した全作品インデックスを(修復したものを)読み込むという処理です。
軽作業ではGUIの反応も体感速度に響きますが、このテストは画面描画速度の影響はほぼ全く無いテストになります。
結果から言うと、概ね、画面操作以外での体感速度と非常に近い比率になっているように感じます。
使用したUSBメモリはシーケンシャル読み出しで100MB/sを超えるものです。
USBメモリの速度の影響は、CPUが速いほど支配的になっていきますので、
USBメモリを使用するというのは、どちらかというと遅い機種に有利な条件です。
400MBのファイルの処理に1分超えの時間がかかっていますので影響は少ないと思います。
N4100 (PASSMARK Multi:2872 Single:1068) 4分15秒(255秒) TDP上書き無しでも9W設定
J4125 (PASSMARK Multi:2980 Single:1167) 3分55秒(235秒)
5005U (PASSMARK Multi:2025 Single:1150) 2分47秒(167秒)
N5095 (PASSMARK Multi:4126 Single:1524) 2分41秒(161秒)
4300M (PASSMARK Multi:3050 Single:1735) 1分56秒(116秒)
5257U (PASSMARK Multi:2984 Single:1835) 1分55秒(115秒)
4590T (PASSMARK Multi:3970 Single:1650) 1分55秒(115秒)
6500T (PASSMARK Multi:4764 Single:1787) 1分48秒(108秒) ←中古で15000円くらいで買えるミニPC
8259U (PASSMARK Multi:7991 Single:2229) 1分36秒(96秒)
このように、画面と関係ない処理でも、PASSMARKで約3000のJ4125よりはPASSMARKで約2000の5005Uの方がけっこう速いです。
なお、xlsxファイルをダブルクリックしていますので、テストにはアプリの起動時間も含んでいます。
----
400MBのxlsxファイルを開く機会は多くないかもしれませんが、概ね体感速度に比例しているように感じるので、もっと小さなファイルであっても、速度の比率の関係は崩れないと思います。
WindowsUpdateにかかる時間も、概ねこの結果と比例しているように感じます。
※これが重要。低速機ではWindowsUpdateが、かなりストレスになります。
5005Uに限りません。PASSMARKの数字がほぼ同じでも、J4125よりi5-4300Mの方が実際2倍速い。
実際に処理時間測ってこの差が出ます。このように体感速度も処理時間も、PASSMARKの数字と比例しません。
PASSMARKでJ4125とほぼ同じ4300Mと比較して処理時間に2倍差がありますが、
実はこの数字、5005Uとも比例していて、PASSMARKで1.5倍で処理時間が1.4倍です。
1.5×1.4=2.1。PASSMARKの値に対して2倍差で一致しています。
つまり、このテストでは、N、Jシリーズの4コア品は、Core iの第4世代、第5世代あたりの2コア品と比較するとPASSMARK値に対して、おおよそ半分程度の実力ということです。
実際使って感じる体感速度もそれに近いです。
そして、Core i同士の比較では、4300Mと6500TのPASSMARK値には1.5倍以上の開きがある割に、処理時間は僅差です。
PASSMARK値はコア数の影響を受けやすいが、このテストではコア数が増えても、
待ち時間はあまり変わらないことを意味します。
軽作業全般で、同じ傾向だと思います。
一般的にシングルスレッド性能が体感速度の目安になる(マルチスレッド性能は体感速度にあまり影響しない)ということは知られていますが、シングルスレッド性能のスコアも実際とは結構差があることになります。N5095の方が30%以上速いはずですが、実測値では僅差です。
PASSMARK シングルスレッド
5005U 1150
N5095 1524
コア数が多いほど、PASSMARKスコアと体感速度が比例しなくなる。
なので4コアのNxxxx、JxxxxのPASSMARK値を2コアのCore iと比較すると、体感速度とぜんぜん比例しない数字になります。
同程度のPASSMARK値の2コアのCore iと同じくらいと言ってしまうと、実際には体感速度は2倍以上の開きになってしまうと思います。
(比較対象にもよりますが、GPUのテクスチャーレートも2倍以上差がある場合が多いので、画面描画速度にも2倍以上の差が出てしまいます)
グラフにすると、2コア4スレ品と、4コア4スレ品で、2本の点線が引けそうです。
2コア4スレ品と、4コア4スレ品で、(マルチコアが威力を発揮するアプリを走らせるとき以外は)PASSMARKのスコアと実際の処理速度には2倍の差があるという線です。
4コアCPUと2コア4スレCPUのPASSMARKのスコアが同じであれば、実際には(マルチコアが威力を発揮するアプリを走らせるとき以外は)4コア品の速度は2コア品の半分であるという意味の線です。
点線は直線で書いていますが、横軸は処理にかかった時間なので、実際には左に行くほど傾斜上がっていく二次曲線になります。
どれだけ速くなっても、処理時間はマイナスにはならないので、左に行くほど上に伸びます。
PASSMARKのスコアがほぼ同じJ4125と4300Mで実際の処理で2倍の時間差が出ます。
PASSMARKのスコアに2倍以上の開きがある5005UとN5095の処理時間が僅差で、はやりPASSMARKと処理速度の関係は、ほぼ2倍になっています。
なので、基本は2コアのCore iと比較する場合は、2コアCore iのPASSMARK値を2倍した数字と比較した方が良さそうです。2コアのCore iと比較している場合、だいたい半分程度の速度です。
実際に使って比べても5005UとN5095機は、画面描画速度には数倍の速度差がありますが、『画面描画を抜きにしたらどっちが早いかよくわからないな』というのが私の感覚で、実際xlsxファイルの読み込みでほぼ同じ時間で処理しています。2分47秒と2分41秒の差は体感できないです。ほぼ同じとしか感じない。
体感速度とテスト結果が一致しています。
なので、ベンチマークのCPUのスコアで2コアのCore iとほぼ同等だと、実際の体感速度は半分です。
実際に処理時間を比較しても半分です。
4コアのNxxxxと比較するのであれば、同じ4コア4スレのCore iと比較しないといけませんが、単純にPASSMARKで見ると数字が低いのは2コア機なので、4コアだと比較できるほど遅いのが存在しないのです。
……と思ったら、なんと、うちにありました!
4590T(4C4T)(PASSMARK 3970)です。
中古でHDD搭載で10000円くらいで買ったミニPCです。HDDが付いてたのをSSDに交換しています。
ジャンク品みたいなやつでも、中華ミニPCより信頼性高く、外付けSSDくらいは安定動作できる程度のUSB給電能力もあり、用途によっては悪くありません。
ただし、Windows11非対応ですが。
Windows11よりもWindows10の方が先にサポート打ち切りになると思いますので、そういう意味では寿命はWindows11対応機より短くなります。
私はこのPCはあんまり使いませんが、使わない理由は優等生、平凡すぎるからです。
たまに遅いPC使いたいときには、これでは遅さが足りませんし、不安定になったりもしない。
PASSMARKで比較するとN5095の4126より若干低目ですが、ほぼ同等と言って問題ないでしょう。
実際に、エクセルファイル読み込み時間を測りました。
1分55秒(115秒)です。
PASSMARKスコアで少々劣っていても、実際に何かさせるとだいたいCore iの方が速いです。
4590T(4C4T)(PASSMARK 3970) 1分55秒(115秒)
N5095(4C4T)(PASSMARK 4126) 2分41秒(161秒)
処理時間が1.4倍で、PASSMARKスコアが1.04倍。
4コア(4C4T)同士の比較であれば、PASSMARKで0.7倍の数字のCore iと近い速度になります。
4C4T同士であれば、Nxxxx,Jxxxxが4000であればCore iの2800と同等の速度くらいになります。
4C4T同士であれば、PASSMARKスコアが同じCore iは1.46倍速い。
PASSMARKスコアが同じ2コア4スレCore iは上で書いた通り2倍速い。
より新型のN95ならPASSMARKで約5500です。
おそらくCPU処理能力で4590Tより僅かに遅い程度。ほぼ同等と言っても問題ない程度の速度だと思います。
ただし、画面描画速度は2倍以上の開きがあります。
テクスチャーレートはN95の9.6GT/sに対して、4590Tは22GT/sなので、画面描画を伴う操作ではレスポンスには多少なりとも差が出ると思います。それでも、2倍遅いとは感じないはずです。
N95(PASSMARK 約5500)とi3-5005U(PASSMARK 2025)だと、N95の方がCPUはやや速く、画面表示で半分程度、体感速度はある程度近いものになるのかもしれません。
※こう書いてますが、実際使ってみるとN95は体感速度は5005Uよりかなり速かったです。
Alder Lake N世代には過去のN/Jシリーズルールは通用しません。
中身は昔の4C4T Core iと非常に近いものだと思います。
--------
比較対象が第5世代の5005Uなのは単純に私が所有するCore iの中で一番遅いからです。
第二世代のノート機も持っているのですが、2コアでPASSMARK約3500なので、4コアのN、Jに換算すると、おそらくPASSMARK約7000に匹敵するくらいの体感速度で、かなり速いのです。
(ブラウザやOfficeアプリ等の軽作業での話)
初期のCore iは高級路線なので、低速版が存在していても数が出回っていないのです。
当時は省電力よりパワーの時代でしたので。
(第3世代のi5-3470が77W、第4世代以降は65Wで、その頃に舵切りが発生しています)
省電力に舵が切られるのは、結局のところCPUの速度向上が頭打ちになって、速度が売りにならなくなったからなので、それ以前の時代の低消費電力版は、あまり多く出回っていないのです。
なので、今のところ私の持っている最低速Core iは2コア4スレで2.0GHzの5005Uになります。
----
持っているというだけであれば、第一世代のi5-450M機も持っています。
CPU処理能力的には5005Uより高いか同等程度なので、一番遅いPCになる可能性はあります。
WindowsXP時代のPCですので、Windows10がまともに動いているかわからないような状態だったり、
(動くけど操作に引っかかりがある)
4K出力ができなかったりと、かなり比較が難しい状況にあります。
そういった意味もあり、まともに比較しようと思うと、事実上第4世代以降になってしまいます。
もっと古い世代だと、ディスプレイコネクタがDVIとアナログ出力で、4K対応してなかったりします。
================
私の持っている5005U機は、ミニPCです。
J4115機が売られていた時代のものです。
第5世代はDDR3です。あの時代すでにDDR3のPC売られていませんから、
”なんで今更、DDR3時代の第5世代Core iが出回ってるんだ?”という感じでした。
当時のミニPCの価格で、メモリ増設もできないようなJ4115のPCに3000円足すと、メモリ増設可能でPD電源使用可能な5005UのPCが買えるような価格設定でした。
この当時DDR3メモリは、余ってましたので、空きスロットがあるならメモリ増設は可能ですし、同じ8GBでも、元が8GB×1であれば、4GB×2にした方が速くなります。
PD給電可能であれば、専用のACアダプタが無くても汎用品で済むので便利です。
ミニPCこそ、PD電源対応していた方が便利です。
※このPCでは問題ありませんのでPDで使っていますが、電源に難有りなPCでは
電源容量に余裕のあるPD電源使うより、専用ACアダプタの方が安定しやすい
場合があります。
速度にはさほど期待していなかったのですが、メモリ増設可能で、さらにPD電源対応な時点で3000円多く払っても構わないような気がして買ったところ、使ってみたら体感速度は2倍以上速いという驚異の速度差がありました。
--------
あの当時は、RYZENショックで、それ以前の数年間と進化の速度が一気に変化し、INTELが在庫放出やらテコ入れしていたのだと思いますが、あまり市場に出回らなかった第5世代Core iが放出されて、妙なスペックのミニPCが売られたり、Gemini Lake世代が知らぬ間にGemini Lake refreshに入れ替わって、同じ名前のPCのCPUが入れ替わっていたり、仕様と違うCPUが乗ったPCが届くといった混乱がありました。
--------
============================================
■体感速度に一番近いパラメータは何か
CPUのスコアはコア数の影響を受けますが、コアが増えて上がった分の数字は、軽作業の体感速度には、あまり影響しません。つまり、コア数の異なるCPUの体感速度を測る数字としては不適切に思えます。
CPUの項目が体感速度にあまり比例しないとすると、どの項目が体感速度に近いのか。
調べてみました。
ベンチマークテストでどの項目が体感速度と一致しやすいか確認していると、
"Memory Read Uncached"これが体感に近いことがわかりました。
なぜに"Uncached"?とは思うものの、とにかく体感速度に近い項目です。
CPUクロックで速度を稼いでいるCPUだと数字が上がらないようで、これはこれでJ4125の数字が低すぎますが、全体的には体感に近いです。
CPU "Memory Read Uncached"
-------------------------------------
N4100(4C4T) 3,700 ※最大15Wくらい行くのですが何故か遅い
N3450(4C4T) 4,217
J4125(4C4T) 4,360
N5100(4C4T) 7,124 ※6W版(スペック通り)
N5095(4C4T) 10,189 ※20W設定(スペック上は15Wです)
i3 5005U(2C4T) 10,113
i3 8145U(2C4T) 15,418
i5 5257U(2C4T) 13,263 ※23W制限版(スペック上標準は28W、23Wはパワーダウン設定時)
i5 4590T(4C4T) 13,540
体感速度で重要なのがメモリ性能(CPUのメモリアクセス性能。メモリ帯域の話では無いです)であることは経験上わかっていましたが、なぜに"Uncached"なのかという疑問がありました。
キャッシュに入っていないメモリの読み込み速度は、メモリ帯域と、キャッシュ段数のペナルティーで決まりそうな気がするのですが、まるで違う結果が出ます。
DDR3とDDR4の差が出ない。DDR4のN、JシリーズよりDDR3のCore iの方が速い。
キャッシュはミスしないように複数のレベルが存在しますが、ミスしないように段数を増やせばそれに比例して、速度は遅くなる……と思ってました。
キャッシュが強いCPUほど、"Uncached"に弱い傾向があるのではないかと考えていたのですが、そんなことは無いようです。
5005Uと5257UはIAとしては単なるクロック違いですが、クロックに比例と言うほどではないものの、けっこう差が出ています。さらに高クロックの8145Uではさらに高い数字が出ています。
クロック順に並べると直線引けそうな感じです。
理由は不明ですが、とにかく測定した結果"Uncached"の項目が、体感速度と一番一致しました。
単純にUncach領域のアクセス……つまり、I/Fに使う領域のアクセス速度が体感速度に直結するというだけなのかもしれません。
表示用、音声用領域や、ディスクの読み書き、通信用のI/F領域、USB用のバッファのアクセスはUncachになるので、それが影響しているということなのかもしれません。
この時点でも、ある程度は体感速度と近いのですが、これはこれでN5100とN5095が高すぎる。
N5100とN5095は5005Uと比較して画面描画はかなり遅いです。
逆に言うと、N5095はGUIに足を引っ張られているだけで、画面描画と無関係の処理では第5世代(つまりDDR3時代末期)の2コア4スレ2.0GHz相当の処理能力を持っている可能性が高そうです(4コア2.9GHzで2コア4スレ2.0GHzと同等くらいの速度)。
ただし、N3450とJ4125の間には体感できる速度差がありますし、J4125とN5095のCPU速度が2倍以上ということもあり得ないので、これはこれで、キャッシュが2段構えのCPUと3段構えのCPUで差が大きすぎます。
画面描画を抜きにしたら、N5095(20W設定、4コア4スレ2.9GHz)とi3-5005U(15W設定、2コア4スレ2.0GHz)は、どっちが速いかはよくわかりません。
(なので、N5095と5005Uの数字が非常に近いことには違和感はあまり無い)
GUIでは、”画面描画が遅い≒体感速度が遅い”になります。
GUIでは人間は画面を見て操作し、人間の操作にPCが即画面描画で反応しますが、基本その全てがかなり遅い。
CUIだと、PCの反応を待たずに、どんどん指示できます。
なので、画面が追いつくのが遅れても問題ないのですが、GUIの場合、確認画面が出る前にボタン押せませんから待つ必要があります。
"Uncached"が体感速度に近いことはわかりましたが、画面描画が遅いだけでx86命令の実行速度が速いCPUの数字が体感速度に対して異様に高くなってしまっています。
スクロールすると、すぐ真っ白になるわけで、どう考えても画面書き換えは確実に遅いのです。
なので"Uncached"とは別に画面が遅い理由があるはずです。
で、白画面や画面描画の遅さですが、ベンチマークの結果に全然反映されないので、どう表現すればよいのか困っていました。動画は撮れるのですが、動画貼れませんし。貼っただけではよくわからないでしょう。
ところが、体感速度に関係する数字がスペックに出ていることに気付きました。
GPUのTexture Rateです。
シェーダー数とかはスペックに出やすいのですが、Texture Rateはあまり書かれません。
でも、気付けば簡単。現在のWindows GUIは3Dに取り込まれています。
おそらくテクスチャとして扱われている。
というのも、今まで散々、どのCPUが白画面になりやすいか試しているわけで、スクロール時のGPU負荷とか散々測っているわけです。
その数字との相関が凄い。
CPU "Texture Rate"
-------------------------------------
Atom E3957(4C4T) 11.7 GTexel/s 2016年発売
Celeron N4100(4C4T) 7.8 GTexel/s 2017年発売
Celeron N3450(4C4T) 7.8 GTexel/s 2016年発売
Celeron J4125(4C4T) 7.8 GTexel/s 2019年発売
Celeron N5100(4C4T) 9.6 GTexel/s 2021年発売
Celeron N5095(4C4T) 6.0 GTexel/s 2021年発売
Core i3 5005U(2C4T) 20.0 GTexel/s 2015年発売
Core i3 8145U(2C4T) 24.0 GTexel/s 2018年発売
Core i5 5257U(2C4T) 48.0 GTexel/s 2015年発売
Core i5 4590T(4C4T) 22.0 GTexel/s 2014年発売
かなり古いCore iでも、Nxxxx、Jxxxxと比較すると大きな数字です。
これ、もうこの数字の時点でも体感速度と非常に近いのです。
体感では5005UはJ4125の2倍速い、5257Uは3倍速い。
N5095が低すぎる以外は、そんなに違和感無い。
5257Uは単純に数字に比例した速度を体感できませんが、体感速度は十分速ければ飽和しますし、ボトルネックがGPUでは無くなるからでしょう。
Windows GUIは、2Dを3Dの機能で表示しているので、このスペックが効いてくるのだと思います。
テクスチャの処理能力が低いと2Dの描画が遅くなる可能性があること自体は簡単に理解できるわけですが、まさか、そんなものがボトルネックになっているとは思いませんでした。
(それなりのCPUとそれなりのビデオカード刺しておけば、体感速度で不満は出ないと思うので、誰も問題視しなかった?)
デスクトップPCで、速いビデオカードを刺すとテキストエディタが速くなるのも、内蔵GPUでは、この数字が全く不足しているからだったのですね。
だいたい、ある程度速くなると、あまり体感できなくなります。
テキストエディタなんて、簡単に体感速度が飽和するはずなのに、ビデオカード刺すとけっこう簡単に体感できるのです。
電源ピン刺さないと動かないような、でっかいカード刺すとテキストエディタが速くなることに疑問を持ってましたが、普通にWindows GUI表示の負荷があまりにも巨大で、まだ体感可能な領域にあるということになります。
本当に、Windows3.1時代の再来を感じます。テキストエディタとかブラウザを高速で動かすために、わざわざビデオカード刺すという……
2018年頃には、『最近では下手なカード刺すより、内蔵GPUの方が速い(3Dベンチマークで高い数字が出る)』と言われていましたが、ローエンドのRX550でもかなり高速化したように感じました。
実際に数字見ても、はっきりわかります。
RX550では、i5-5257Uには負けてますが、ほとんどの内蔵GPUよりは速そうです。
(ビデオカードを外付け可能なクラスのCPUは、あまり内蔵GPUが重視されていませんので、CPUの処理能力自体が上がっても、画面表示がボトルネックになって、体感速度は上がりにくいように思います。20GT/s程度では、それほどCPU性能が高くなくても体感速度が頭打ちになります)
価格と発売時期の古さの割に高速だったRX570は159.2GTexel/sだそうです。
(GTX1050と価格差がさほど大きくないのにメモリが8GB搭載されていて、割安感がありました)
少なくとも内蔵GPUの10倍くらいは速いかと思ったのに、思ったほどの差はないようです。N,Jシリーズと比べれば20倍速いですが、Core iは20GTexel/s程度は出ているので、それと比較すると10倍も差がありません。
GT1030 35.23GTexel/s 2017年発売のローエンド品(当時10000円程度)
RX550 37.9GTexel/s 2017年発売のローエンド品(当時11000円程度)
GTX1050 58.20GTexel/s 2016年発売のエントリークラス(当時16000円程度)
GTX1050TI 66.82GTexel/s 2016年発売のエントリークラス(当時16000円程度)
GTX1060 120.5GTexel/s 2016年発売のミドルクラス(当時36000円程度)
GTX1660 Super 157.1GTexel/s
RX570 159.2GTexel/s
外付けGPUでも、テクスチャレートとスクロール負荷は完全に反比例しています。
スクロール負荷に対する影響が大きいのは、こいつです。
期待して買ったGTX1660 SuperがRX570に勝てない(大差無い)ところまでリアルです。
メモリ帯域とかバス帯域とか関係なかったのですね……
わざわざ避けて通ったGT1030は、RX550とほとんど差は無いかもしれないという……。
個人的にはかなり納得しました。
2023年現在のレベルでは100GTexel/sでも、軽作業では遅さを感じる場面は少ないと思います。
因みに、1050と1060の差は、ミドルクラスのCPUとの組み合わせれば、ちょっとした操作でも体感可能なレベルです。テキストエディタとかでも体感できます。
RX550と1050の差はかなり簡単に体感できます。i5-3470という古いCPUでも余裕で体感できます。
てっきりPCIeのx8とx16の差で2倍なのだと思っていました。まさかテクスチャだったとは。
(PCIeは最大x16のカードでもWindows GUI使っているときにはx16で動いていないというのもあります)
GTX1060(120.5GT/s)とRX570(159.2GT/s)の差は比べればわかりますが、比べないとわからなかったです。スクロール負荷や、長い文章のスクロール時間に差は出ます。
通常の操作では速度差を体感できる場面はあんまり無さそうです。
単純な話、遅ければ遅いほど差がわかりやすいので8GTexel/sクラスと20GTexel/sクラスの速度差は、かなり簡単に体感できると思います。
それに気付かず7.8GTexel/sのCPUが20GTexel/sのCPUに匹敵するとか言ってる人の話はあんまりあてにならない気がします。
触れば即気付く速度差があります。
ただし、解像度の低いディスプレイでは7.8GTexel/sでも十分になると思いますので、極端に解像度の低いディスプレイを使っている人は気付かないかもしれません。
========
CPUパワー的にはi5-3470くらいでも、twitterのRT不発はあまり出ないです。
このくらいでも十分……と思ったのですが、PASSMARKでi5-3470が4700弱、J4125は約3000なので、遅くても問題ない例としては、イマイチでした。
ただ、RX550が刺さってる状態での(ブラウザやWindows動作全般の)体感速度はJ4125よりも3~4倍速いという感じで、PASSMARKの数字とはかなり大きな乖離があります。
新しいCPUになると、i5-3470よりも高い数字を出すようになります。
ところが、あまり速く感じない。
第3世代の頃はビデオカード外付けするのが普通でした。
どうせカード刺すので特にデスクトップ向けのCPUでは内蔵GPUは比較的低性能な場合が多かったように思います。
その後、ビデオカードの価格高騰が有ったりと、内蔵GPU使う人が増えて、内蔵GPUの性能も上がって、ゲームやらないなら外付けGPUは不要という扱いになっていたように思いますが、個人的には内蔵GPUと外付けGPUではブラウザのスクロール程度の操作でも体感速度に差があって、外付けの方が速く感じる場面は多々存在するような気がします。
内蔵GPU同志、外付けGPU同士の比較ではスクロール負荷はテクセルレートと、ほぼ完全に比例しますが、内蔵GPUと外付けGPUは比例しません。
i5-3470+RX550の組み合わせが、8259Uと同じ速度に感じます。
CPU性能的にはシングルコアで1.6倍、マルチコアでは2倍程度8259Uの方が速いです。
GPUのテクセルレートでも8259Uの方が勝っています。
スペック的に見て、同じ速度ではないのです。
i5-3470 4コア4スレ 3.6GHz L3キャッシュ6MB DDR3 メモリ帯域25.6BG/s
i5-8259U 4コア8スレ 3.8GHz L3キャッシュ6MB DDR4 メモリ帯域38.4BG/s
PASSMARKでi5-3470が4682、i5-8259Uが8019。1.7倍の差があります。
1.7倍の差くらい、テクセルレートで埋まることもありますが、
テクセルレートでもRX550は38GT/s、8259Uの内蔵GPUは50GT/sで3470+RX550の方が劣っています。
もしかしたらメモリ帯域で有利な場面があるのかもしれません。
RX550は112GB/s。CPUのメモリ帯域は、GPUと比べるとだいぶ狭いです。
メモリ帯域が直接体感速度に影響することは無い(体感できる何かがあるはず)ので、何かしらの方法でRX550が有利な場面が可視化できるはずなのですが、そこまで詳しく調べていません。
i5-3470+RX550の組み合わせが、8259Uと同じ速度に体感できるけれど、スペック的には8259Uの方が1.5倍くらい速く感じるはずなので、おそらくは『外付けGPU付けると、テクスチャレート以外にも速度的に、有利なことがあるのだろう』という程度の話です。
消費電力やPCのサイズに大差があるので、i5-3470+RX550は今では使わなくなりましたが、8259Uと体感速度は変わりません。
第3世代でもそのくらいです。
========
J4125より5005Uの方が2倍速く感じるのは、単純に実際のメモリアクセス性能も画面表示速度も2倍以上速いからですね。
5257U(23Wのパワーダウン設定版)が3倍速く感じるのも単純に実際にメモリアクセス性能で2.5倍、テクセルレートが6倍以上速いからです。
テクセルレートが6倍速いのに、体感速度が3倍止まりなのは、ボトルネックが表示ではなくなるから。
逆に、N、J、シリーズがCPUスコアの割にCore iと比較して体感速度で振るわないのも、ボトルネックはCPUに無いからです。CPUのスコアは体感速度にあまり影響しない。
N,Jシリーズは画面描画がCore iシリーズと比較して圧倒的に遅い。
これは触ると即体感可能です。
テクスチャとメモリアクセスのスコアを適当に合成すると、概ね、体感速度と一致するようになります。
5257Uが謎の速さを発揮する割に、他の機種がイマイチだった理由もようやくわかりました。
シェーダー数で見ていましたが、重要なのはテクスチャだったのですね……というか、2Dアクセラレータが欲しくなる速度の原因はコレだったのですね。
見てわかる通り、Core iとの差は大きいです。
(2023/7現在)送料込みで1万5千円くらいでi5 6500T(22.8GT/s)搭載、8GB、256NVMeのミニPCが買えます(当然中古ですが、SSDは新品が付いてることが多いです)。
Windows11の対象外、ディスプレイ出力がDP+アナログ15ピンだったりとか難ありだったりすることもありますが、もともとミニPCに、それほどたいした期待はしていないと思いますので、用途限定ではさほど問題なく使えると思います。
単なる速度の問題であれば、そのくらいの機種でも十分速いです。
”同じ予算範囲内で速いPCが欲しい”というのであれば、そういったものを買えば良い。
もっと金出す気があるなら、上はいくらでもあります。
でも、N、Jシリーズを買おうと思うような人がミニPCに求めるものは、そういうのではないと思うのです。
なので思うのです。
”いったい何と戦ってるんだ?”と。
もちろん、同じスペックを見ても、用途次第で感じ方は変わると思いますが、
私は普通のPCと同じように軽作業をした場合の体感速度の話をしています。
直接操作しない用途では、全然異なる感想になると思います。
また、Jasper LakeまでのN、Jシリーズの話をしているので、もっと新しい世代では通用しなくなるかもしれません。
ただ、Gemini Lake(Refresh含む)世代の頃から、第何世代のCore iより速いという話はよくされていて、私が使っている限りCore-iよりN、Jシリーズの方が速い場面はまず無いので、”いったい何と戦ってるんだ?”という疑問を持っていました。
CPUのスコアは高いかもしれませんが、ボトルネックがCPUに無いPCで、CPUのスコア上げても、実際の速度は上がりませんから、意味のない数字です。
コア数で数字を稼いでいるだけなので、近い数字の2コア機を横に並べて動かすと体感速度では非常に不利です。
そして、体感速度に響く、メモリ性能や、Texture Rateは数字見てもわかるとおり、正直勝負になってません。
例えば、”N5100はCPU性能で第5世代i5 5200Uに匹敵する”と言われていますが、実際は、第5世代i3 5005Uの半分程度という感じの速度です。
※N5100のTDPが仕様通り6W設定であればの話です。
10Wや15W、20Wに設定されれば、その差は小さくなります。
(6W設定の)N5100の方がi3 5005Uより速い場面があるかと聞かれても、私は思い当たらないです。
(3Dゲームは速いかもしれませんが、3Dゲームが用途に入っているなら、N5100機はまず買わないと思うので比べる意味が無い気がします)
7200Uと比べたら1/2.5くらいになりそうです。
軽作業での体感速度はCPUの演算能力はあまり関係なく、メモリアクセス性能や、画面描画処理能力が支配的です(CPUの項目はコア数増やせば上がるが、軽作業の体感速度にはあまり影響しないという意味)。
メモリアクセス性能はperformancetestのMEMORYの項目の1つ"Memory Read Uncached"が、軽作業でのCPU性能をよく表しているように感じます。
画面描画に関しては、Texture Rateがほぼダイレクトに効きます。
匹敵すると書かれている比較対象と、その数字で数倍の差があると、操作した瞬間にその差が即目に見えます。
つまり触れば即わかる。
匹敵しないと問題があるかと言えば、無いです。
なので、わざわざ”匹敵する”とか言い出す必要もないように思います。
速度が1/2.5くらいだとしても、消費電力も1/2.5くらいですから、バランスは良いと思うのですよね。
わざわざCore iと比べる必要などなく、普通に、消費電力の割に使えるCPUとして、なかなか悪くないと思うのです。
もっと速いPCは大量に存在しますが、少し速いのを選ぶと、熱かったり煩かったりすることが多いです。
サーバー側の負荷を考えて、わざと低速で動作するようなアプロケーションも存在します。
例えば、なろうAPIで全作品データをダウンロードしようと思うときも、サーバー負荷軽減のためにwait入れまくってデータを取得します。
終わるまで数時間かかる処理なので、走らせたまま放置したい。
自分で操作するPCで裏で動かすことはできますが、データ取得中なのを忘れて再起動かけてしまったりするので、放置しておけるPCがある方が便利です。
大きなデスクトップ機は消費電力が10倍くらい大きいので、夏は特にエアコンの電気代にも影響しますから2重で効いてきます。
5WやそこらのPCを数時間動かしても、大きな電源積んだデスクトップPC1時間動かすよりずっと電気代は安いわけで、そういった用途にも合っています。
少なくとも私は結構重宝しています。
--------
ノートPCも、Nxxxxのやつをメインで使ってます。
これはNxxxxが好きなのではなく、ディスプレイ要因です。
同じディスプレイ解像度で、十分なバッテリー駆動時間のCore iやRYZEN機があれば、それを使うかもしれませんが、ディスプレイ問題と比べたら些細な話です。
16:9だと、縦が狭くて使いにくいのです。
================
N4100機が特別遅い問題ですが、今さら解決しました。
まず、久しぶりに触ったら記憶にあるより速い。
確認したらTDP9Wになってました。BIOSで設定上書きOFFにしているのに9Wです。
さらにもう1つ。元からGTが電力食いまくっているように見えてました。
消費電力を見ると普通アイドル時はGTの消費電力は0.01Wに張り付くのですが、このPCは常時3W以上食っているのです。
通常の300倍消費電力が大きい。
N100の消費電力がIA(CPU本体)もGT(内蔵GPU)も電力をほとんど食っていない状態でパッケージ電力は5Wほどあります。これを調べるためにいろいろいじっていたので、ついでに、IAが食わなくても、やたら電力食いまくるN4100機を調べていたところ、原因がわかりました。
なんと、BIOS設定のRender StandbyがデフォルトでDisableになっていたのが問題でした。
デジタルサイネージ向けに作られたものだからかもしれませんが、TDP6WのCPUでGPUが常時3W食ってたら、CPUがまともに動けないだろ!!と思ったのですが、 TDPを確認するとなぜかデフォルトが9Wになってました。
今まではやたら発熱するし遅いしで、使い物にならないPCだったのですが、一気に、”使えないということも無い”くらいのレベルに進化しました。
ファンレス機で、元々24時間運用に買ったものなので、常時運転向けの用途を探してみようと思います。
※結局出番無しという不幸な結果に終わりました。
省電力でそこそこ速いという用途ではJasper Lake(N5xxxシリーズ)のバランスが秀逸です。