東芝SSD HG3 購入レポート


2011/03/09 YUKI
実際購入したのは、SVP100S2/512Gです

ちなみに、初東芝です
各種ベンチはさんざん出ているので、ここでのテーマは「CDMはいろいろな値が出る」というのに絞ります
使用期間は1日、Win7でアライメントは合っています
(X58-XBX i7-920 2G*3 Win7pro)

まずは、CDMの1000Mを回数1回で実行、今後もすべて1回
SR-237 SW-202 RR512K-210 RW512K-152 RR4K-20 RW4K-37
と、普通のHG3である
QD32はQD1とほぼ同じなので省略
次に、「100M書いて、書いたデータをランダムに500M選んで読む」を繰り返す自作のテストを開始、テストAと呼ぶ
Windows Tools

テストAを走らせながら、CDMを走らせると、ほぼきれいに半分くらいの結果が出る
このあいだ、もっさり感や引っかかりはない、いい感じ
しばし待ち、300Gほど埋まってきた頃から、徐々に速度低下が始まっていることに気づく
この状態でテストAに平行してCDMを走らせると、さらに半分くらいの結果になってる
しかしながら、ベンチは遅くはなったものの引っかかり感が全くないことに驚いた
で、いったんテストAを停止、すぐにCDMを走らせると
SR-230 SW-173 RR512K-208 RW512K-26 RR4K-20 RW4K-25
おお、書き込み劣化してる!ものすごく
まず、ここまでだが、C300やX25-M G2で同じことをやったときよりはマシ、こいつらの場合、シーケンシャルでも落ちてくるから
そのうえ、プチフリまでは行かないが、言葉では言い表せない0.5秒単位の細かい引っかかりが多発する
しかし、HG3は待つ時間自体は長くなった気がするが、平行して作業しても引っかかりはない
というか、しばらく触っているが、遅くなった感じは全くない
と、もう一度CDMしてみたら驚いた、なんとSWが174になった意外、すべての値が初期の結果と同じ値まで復活している!

とりあえず、テストAを再開する
再開し、しばらくすると、また遅くなってきたようだ、平行でCDMすると、やはり落ちてる
で、のこり5Gまでゴミで埋まったら即CDMを実施
SR-230 SW-173 RR512K-209 RW512K-19 RR4K-20 RW4K-16
ランダムライトが異常に落ちてる
3分後もう一度実施
SR-223 SW-171 RR512K-208 RW512K-151 RR4K-20 RW4K-35
ん、なんか、SW以外はだいたい復活してる
というか、SWのスペックは180だから、これが本来なのかもしれない

とりあえず、のこり5Gで、同じところばかりすり減らそうと(WA誘発狙い)CDMの4000を立て続けに3発実施
SR-235 SW-192 RR512K-210 RW512K-150 RR4K-20 RW4K-2.1
SR-238 SW-200 RR512K-211 RW512K-13 RR4K-20 RW4K-1.1
SR-229 SW-171 RR512K-208 RW512K-27 RR4K-20 RW4K-2.5
RW OSEEEEE!!
でも操作は普通にサクサク動く、ちなみに、X25Mもこんな感じでC300はもっとひどい
でももっともっとひどいのは、古いVertex(シリーズ名は忘れた、2009後半あたり)や、CSSD-SM128NIとかその辺
数分経過後、もう一回CDM
SR-236 SW-194 RR512K-210 RW512K-151 RR4K-20 RW4K-3.2
512は復活したがやっぱり遅い、そりゃ仕組み上、しょうがないのかな

飽きてきたので、50Gほど削除、直後にCDM4000
SR-238 SW-200 RR512K-211 RW512K-27 RR4K-20 RW4K-3
Trim効かない??
で、数分後CDM1000
SR-225 SW-171 RR512K-208 RW512K-154 RR4K-20 RW4K-37
さらにもう一回
SR-229 SW-172 RR512K-208 RW512K-153 RR4K-20 RW4K-37
安定してる
もしかして、4000が遅い?
立て続けにCDM4000*3回
SR-236 SW-192 RR512K-209 RW512K-149 RR4K-20 RW4K-6.6
SR-235 SW-193 RR512K-210 RW512K-150 RR4K-20 RW4K-25
SR-235 SW-191 RR512K-210 RW512K-152 RR4K-20 RW4K-24
よくわからん
で、CDM1000
SR-229 SW-172 RR512K-208 RW512K-156 RR4K-20 RW4K-37
ぜんぜん、かわらない
とりあえず、使用感も最初のまま、90%使用中のSSDとは思えない
全体を通して、かなりポイントと思うのが、シーケンシャルからランダムまでリードは劣化しない
X25MもC300もリードも劣化してくる、それから比べたらすばらしい

結論、花(ピーク性能)はC300 X25-M
実(持続性能)はHG3
こればかりは、何度聞いても実際に買わないとわからないね
とりあえず、今まで使った中では一番いい、SATA2最高峰だと思う
これをつなぎにしておいて5月にG3買うつもりだったけど、微妙かもしれない

半年くらい使ったらまたレポります
SATA3もこなれてきたら試したいなぁ


NCQ考察「なぜ東芝は、NCQ対応しないのか?」


2011/03/11 YUKI

ZIPの解凍をはかってみた
テストPCは、上と同じ
テストファイルは、エロ画像詰め合わせzipを13個用意した

圧縮ファイル
zip13ファイル、総容量4.59G、平均ファイルサイズ約340M
解凍ファイル
総数jpeg5825ファイル、総容量4.62G
解凍ソフト
+Lhaca1.24
設定は、ファイルと同じ場所に解凍、フォルダを作ってその中へ解凍、解凍後フォルダは開かない、全ファイルが圧縮形式なら解凍

それぞれ、CDM1000M1回の結果も併記
zipの値は3つあるが、左から、
1:同じドライブ内でzipファイル自体をコピー
2:13ファイルを選択し、エンターキーを押し、同時にlhacaを起動させ、すべて解凍が終えるまで
3:13ファイルを選択し、lhacaのアイコンにD&Dし、順次解凍が開始し、最後の解凍が終えるまで
それぞれ、括弧内は、コピー(一つ目のタイム)との差分

※OSのキャッシュなどは切っていない為、リードキャッシュや小さなライトバックバッファは有効となるが、環境をそろえ十分大きなデータを使用し相対値を検討に用いるため相殺とする、またウインドウが消えた時点で処理完了とみなす、また試験は一度のみである

テスト対象は、特にHG3は、一昨日の試験から連続劣化試験を仕掛けている
そして、劣化解消の儀式をそれぞれ行いタイムを計測した

HG3
劣化解消儀式 DISKをクイックフォーマットのみ
SR-220 SW-202 RR512K-204 RW512K-145 RR4K-20 RW4K-37 RR4KQD32-21 RW4KQD32-33
zip 0:53 1:25(0:32) 1:55 (1:02)

X25V
劣化解消儀式 DISKをクイックフォーマットし、ツールに通す
SR-196 SW-43 RR512K-157 RW512K-44 RR4K-23 RW4K-34 RR4KQD32-136 RW4KQD32-42
zip 2:00 2:20(0:20) 3:19 (1:19)

CSSD-SM128NI
劣化解消儀式 正式なやり方を知らない、とりあえずフォーマット後、0フィルファイルを残容量0になるまで一度書いてもう一度クイックフォーマット
SR-152 SW-26 RR512K-132 RW512K-14 RR4K-29 RW4K-2.5 RR4KQD32-65 RW4KQD32-2.6
zip 4:25 8:25(4:00) 6:55(2:30)

参考1:mobi3000*2(Adaptec3405raid0) NCQ非対応
劣化解消儀式 DISKをクイックフォーマット
SR-167 SW-96 RR512K-103 RW512K-71 RR4K-8.9 RW4K-1.6 RR4KQD32-20 RW4KQD32-1.9
zip 1:28 2:15(0:47) 2:36 (1:12)

参考2:WD30EZRS(5200rpmHDD)
SR-110 SW-53 RR512K-34 RW512K-38 RR4K-0.40 RW4K-0.68 RR4KQD32-1.4 RW4KQD32-0.84
zip 2:45 10:35(7:50) 4:20 (1:35)

参考3:ANS9010B(SATA2-RAMDISK) NCQ非対応
SR-187 SW-152 RR512K-187 RW512K-152 RR4K-75 RW4K-67 RR4KQD32-96 RW4KQD32-86
zip 0:57 1:00(0:03) 1:58 (1:01)

ここのSSDは、手持ちのうち引退した物のみ、デスクトップに付けて計測したので、ノート現役のC300やX25Mは入っていない
ノートは現役業務マシンなので、それらが保守に回収されたら計ってみる

結論としては、古い機種やHDDは明らかに遅いということと、RAMDISKは異常に早いということ(滝汗
そして、体感とNCQの関係がわかった(かもしれない)

考察にはいるが、まず差分をみると面白い

まず、参考3、これは、人柱用のSATA2のRAM-DISKであるが、コピーと、13プロセス並列解凍の差異が3秒しか無い
解凍計算が完全にまぎれるほどであり、驚異的なマルチタスキング性能と言える
そして、順次解凍の場合、1分ほど時間がかかるが、これは、解凍ソフトがシングルスレッドアプリであり、リードしなければ解凍計算できず、解凍計算が終えなければライトできない、さらにライトが終えなければ、次のファイルのリードが始まらない、ということで、純粋に計算処理分の時間と考えられる
これをリファレンスとして、各SSDを検証する

まずはコピーと順次解凍の差に着目する
HG3は差が約1分であり、ANSとほとんどかわらない
他の機種はいずれも若干長いが、これらの時間は、リードとライトのミックスによる、効率低下と考えられる(これは嘘で以下で別の原因が浮上する)
mobi3000*2が遅いのは、RAIDカードも含め世代がふるいからだろう
HDDはもちろんシークが増える分長くなる
そして、それほど酷使した訳でもないのに性能劣化している糞SSDは鬼のように遅い、これは無視する
最後に、一番解せないのが、X25Vが20秒ちかくも余計に時間がかかる点である
シングルタスクのリードライトミックスは苦手なのか?、謎の20秒と呼ぶ

これを踏まえ13同時解凍の差をみてみる
ANSは早くて当然だが、X25Vはコピーと比較し20秒しか追加分が無い
しかも、この20秒は、前述の謎の20秒に一致する
リードライトのミックスで消える謎の20秒を考慮すると、順次読書でも同時読書でも、全くパフォーマンスの変化が無い強烈な設計と言える
ところがHG3では、32秒追加でかかっている
順次処理では、きっかり性能を出すにもかかわらず、並列処理が明らかに弱いのだ

これが、NCQの力なのか!!

謎の20秒のパフォーマンスダウンの件を考慮すると、以下のような仮説がたつ

仮説1:
X25Vでは、リードやライトとも常にキューイングの為の待ち時間を設けている
そして、待ち時間にキューイングしたジョブは有効な順序で処理を行う、だから、いずれの場合も+20秒かかった
結果、NCQリードのパフォーマンスも高い

仮説2:
HG3では、NCQに対応しておらず、すべて処理を直ちに行う
シングルスレッドの順次では、ライトも連続アドレスであり、待ち無く進むので、余計な時間はかからず高効率である
しかし、ランダムライトについてはアドレスがばらつく為、内部でキューイングし即時結果を返すが、キューからブロックライトが行われるのは、十分にライトバックバッファがたまってからである、このためライト要求が長く続くと、溜めたバッファが吐ききれず待ち時間が長くなる

次に、仮説を検証する

一般的に、最新世代のSSDでは、WAの都合でバラバラのアドレスのライト要求でも、空きの同一ブロックへガンガン一緒に書き込んでしまう、コントローラのアドレス管理はややこしくなるが、細かいライトのパフォーマンスも上がり、WAにもつながり一石二鳥である
しかしこれは、そのあと、書き散らかしたデータは、連続化処理という非常に面倒で重い作業を後に残す
空きブロックがあり、こいつらバックグランドでさばききれれば良いが(GC処理)、空きが少なければ、あっという間にキチガイの様にパフォーマンス低下を招く
東芝の場合、とあるインタビュー記事にもある通り、ライト要求については、なるべく連続アドレスのデータが同じブロックへ書き込まれるよう、かなり長い時間バッファにプールすると考えられる
これは、瞬間的な細かいライトのパフォーマンスより、恒常的な負荷でもフレグメンテーションが起こり難く作ってあるという理論に一致する
もちろん、完全にふぜげるわけでもないので、GCは発生する、そして、数分待つとパフォーマンスが復帰する前回の結果とも一致する

また、RW4KQD32の値がRW4KQD1より低い点は、直前のQD1で詰まったライトバックバッファが吐き切れておらず、すぐにバッファが埋まってしまうからと判明した
実際、10秒ほど待ち、単発でRWQD32のみ実行すると、リード/ライトそれぞれ21/36という、QD1とほぼ同じ結果が出る
ここから、4000Mでランダムライトが振るわないのもバッファが詰まりすぎるのが原因と導ける
ただ、実使用でそれほど長い時間、細かいランダムライトが連続で発生することなど無い(高負荷のプロキシサーバでもない限り)
少なくとも数十Mのサイズであればランダムライトは非常に早い(50Mで試験するとRW4Kは80ほどの値が出る)
10Mとかなら、200M/sとか出るのではないか?、このあたりもベンチの値のわりに体感が良い要因と考えられる

これらのことから、先の仮説は正しいと思われる

結論すると、前項の「これが、NCQの力なのか!!」については、まさにこれがNCQの力なのだ

つぎに、このNCQの力が有用か否かを考える

体感の件だが、C300やX25Mで地味に細かい引っかかりを感じることを思い出す
これらは、バッググランドでインデックスを作成していたり、ちょこっとした読み込みが発生した時など、NCQ対応のため他のコマンドの要求を待つのだ、待ったあげく、追加の要求は無く結果が帰る、結果が返るまでは長い待ち時間を要する(0.05~0.2秒程度)
すなわち、NCQ対応のSSDはリード要求もキューイングする為、同時負荷には強いが、シングルスレッドとしては必ず一定時間の無駄待ちが発生すると考えられる
これが、ベンチでは特にNCQリードで高い値をたたき出すが、「なぜか」体感は引っかかる
「なぜか」ではなく、「当然」であり、これらベンチと体感のギャップ現象の神髄である
待ち時間を長く取れば、NCQリードのパフォーマンスはもちろんあがるからだ

NCQリード値が高い物は体感は引っかかると考えた方が正しい可能性すらある

で、実際にHG3はプロキシサーバやDBサーバには向かないだろう、しかし体感レスポンスが非常に良い
IntelやC300は、並列的な高いIOPSを必要とするサーバに向く(信頼性は別)、そして体感レスポンスは引っかかりがある
特に、操作の印象を最優先するAppleが純正で採用する理由はここかもしれない

話はそれたが、結果の検証に戻る

HDDはもちろん同時より順次の方が早い、いずれにしろ、試験中ずっと哀愁漂わせながら、せつなそうにゴリゴリ言っていた
(SCSI15Kやベローチラプタンなら、これより3倍程度は早く確実に体感できる、とはいえSSDにはほど遠い)

次に、HG3とX25Vの結果からC300やX25Mのパフォーマンスを推論する

ともに、リードは200M/s程度でほぼ同じ、連続ライトでは数倍差がある
HG3では、コピーが53秒なので、内訳をリード20秒、ライト30秒と仮定する(サイズ的にそれなりに合うし誤差はスルー)
このばあい、X25Vでは、内訳が、リード20秒、ライト100秒となる(こっちの計算もそこそこ合う)
そして、解凍については、それぞれ、32秒、20秒のびているので、
HG3 リード20秒、ライト62秒 (NCQが無いのでライトのみ増加)
X25V リード30秒、ライト110秒 (リードライトともに半分ずつ増加)
とりあえず、雰囲気はこんなところか?

すなわち、13プロセス同時アクセスで、ライト性能が、HG3では50%に低下、X25Vでは90%に低下という具合である
テスト中、DISKプロファイラ上でキューの長さは30程度までのびていたことを考えると、前述の通り、NCQ有無の差と考えられる
50%へ低下とはいえ、絶対的にはX25Vより倍程度も早く、おそらく、X25MやC300より、大きく見劣りしないだろう
その分、WA比をあげる為の、「持続性能」を重視した東芝の設計が現れていることだろう
普通の使用なら、この程度の並列性能が出ればまず困ることはないだろうし

そして、以上の値から、C300やX25Mのパフォーマンスを推論する(機会があれば試す)
いずれもNCQ対応でX25V特性はにているため「X25Vのライトが早い版」と考える

仮想X25MとC300を、それぞれ連続ライト性能が、X25Vの3倍と4倍になったと仮定する
先のHG3とX25Vの考察から、以下の値と仮定する
コピーの値
X25V リード20秒、ライト100秒
X25M リード20秒、ライト35秒
C300 リード20秒、ライト25秒
そして、13同時解凍がX25Vと同じくNCQ効果が+20秒であったと仮定
X25V リード30秒、ライト110秒 合計2:20
X25M リード30秒、ライト45秒 合計1:15
C300 リード30秒、ライト35秒 合計1:05

結論的には、これらの予測でも、結果の値をみると、やはり、X25MやC300が早いタイムをたたき出す
少なくとも、この手のベンチはHG3より早い
たとえ、10%から30%程度であったとしても、これらのSSDはベンチで負けてはならないのだ

さいごに

NCQベンチの早さは、体感を捨てたから得られた物かもしれない
実際にベンチも体感も向上させる為には、RAMDISKの様に物理媒体を早くするしか無い
ちなみに、RAMDISKの体感は非常に快適であり、HG3もこれに似ている
まぁ、実際にそれに感動したからレポを書いた訳だが

※注意※
あくまで、「NCQリードのパフォーマンスが高い=ひっかかる」というのはYUKIのトンデモ仮説です
どなたか、追加検証をぜひお願いします

HG3そしてその後


2012/03/23 YUKI

購入からだいたい一年たちました、早速ベンチ

状態:95%使用残容量23G CDM3.0.1
1000M
SR-198 SW-170 RR512K-184 RW512K-31 RR4K-16 RW4K-4.2 RR4KQD32-19 RW4KQD32-1.6
4000M
SR-208 SW-186 RR512K-188 RW512K-33 RR4K-16 RW4K-0.5 RR4KQD32-19 RW4KQD32-0.5
ランダムライト、超劣化しとりますね、残容量がアレですが・・・

使用頻度はほぼ毎日で、秋くらいから何度もFullになり、やむをえず50Gほど消して、を繰り返しています
ギガが単位で中間ファイルを、吐いたり消したり・・・、比較的過酷な使われ方でしょう
劣化については、以前の試験などから予想できる範囲で妥当ですかね

しかしながら、今でも、大容量ファイルのコピーとかも含め、使用感に違和感を感じないのにはポイントは2点あると思います
・ランダムも含め、リードが殆ど劣化していない
・シーケンシャルライトは遅くない
ということですかね
そもそもランダムライトはライトバックバッファで隠れますので、現実にはあまり無いことだと思いますし

あと、結局徐々に遅くなっているので、気づかないという可能性も大きいです(滝汗

とりあえず、本SSDはまだまだ使い潰れた感もなく、2ndPC、3rdPCに流れていっても、元気に動きそうです
そして、1Tくらいの新製品に乗り換えたいですねぇ・・・本物のインテルか、東芝あたり

追伸 2012/03/29
やけにランダムライトが遅いので40Gほどゴミを消してみた
状態:87%使用 残容量60G CDM3.0.1
1000M
SR-199 SW-151 RR512K-182 RW512K-19 RR4K-16 RW4K-8.4 RR4KQD32-19 RW4KQD32-22
まぁ、想像の範疇だが、中でどんなふうに流動しているんだろうな

さらに追伸 2012/08/29
ずっと使い中、あまり変わった気はしないがベンチを取ってみた
状態:93%使用 残容量30G CDM3.0.1
1000M
SR-189 SW-156 RR512K-172 RW512K-154 RR4K-16 RW4K-33 RR4KQD32-19 RW4KQD32-37
少し早くなった?、元に戻っただけかな
あまり面白味はないが、トラブらないのはいいことだ

さらにさらに追伸 2012/12/15
今年もあとわずか、相変わらずメイン機で酷使中、劣化チェックにベンチを取ってみた
パツンパツンなので、秋口に古いデータを200Gほど削除した
状態:62%使用 残容量178G CDM3.0.1
1000M
SR-212 SW-187 RR512K-191 RW512K-150 RR4K-17 RW4K-32 RR4KQD32-19 RW4KQD32-37
空きが多くなったせいか連続レートは上がったかな?、まぁ誤差レベルの変動
まさに鉄板、驚くほど何も起きない・・・
これ、容量2Tとか出れば50万でも買うんだけどな