データサイエンティスト検定(リテラシーレベル)第2回受験

受けてきました。データサイエンティスト検定(DS検定)リテラシーレベル。
https://www.datascientist.or.jp/dskentei/
2022 6/10~6/30が試験期間で、6/12 10:00~なので割と序盤
翌週の予定でしたが、予定ができたので直前に繰り上げ。行きやすところが行きたい時間に空いているかは運ですね。私は西日暮里駅前のところで受験。駅前じゃないところ多いよ……。とはいえ東京は便利な方なんでしょうけど。

  • 速報値:91.1%
    • 実際の得点410点
  • データサイエンス:86.6%
    • 195点
  • データエンジニアリング:92.0%
    • 115点
  • ビジネス:100.0%
    • 100点

Twitter検索すると、まあ落ちる人は公開してないケースも増えると思うので、前回のボーダーが8割程度らしく、それ以上の人が多くいるように見えますね。
と思いましたが、前半に受験した人は余裕がある人が多いのか、終盤は8割付近、全然だった人などもそこそこいました。

DS検定感想

正直「リテラシーレベル」なのもあって、データサイエンティストでもなんでもない、Kaggleを少しかじった程度の私でも勉強時間は資格試験過去最低くらいのものでした。とはいえ駆け出しエンジニアくんたちが受けていることも多そうで、まあ落ちる人もいるよねという感じでもあります。
まず駆け出しの人はこんなクソ資格取ってないで、実際にコード触ったりデータ触ったりしておけという気がします。資格としてもしっかりとした信頼性のあるIPA試験の方が価値があると思います。
Di-Liteとか言って箔をつけようとしていますが、G検定とともに大した価値のない資格に感じます。

G検定は対象がゼネラリストであり実装者ではないというところで試験範囲や公式本は非常に良いと思っていますが、データサイエンティスト検定は対象が実務者な分、試験と技術が直結しない。そういう中でリテラシーレベルなので技術がある人は当然受かるだろうけど試験を通らない人はまずやること(試験を受けようとすること)が間違っていると感じます。

Di-LiteとかいってITパスポートと組んだりしている割に、データエンジニアリング分野はそっちに突っ込みすぎている気がする問題もありました。そもそも公式リファレンスとか出しているのに、あまりにも逸脱したものを出すのはG検定とお仲間ですねという感じは受けます。

あとはなんとなく組織の信頼度が低いです。まだ2回しか実施していなくて信頼を得ていない中で、公式ガイドブックに誤植がある、問題の答に誤植があるが解説なしの答えのみなのでわからない、もともと7月下旬という曖昧な結果発表日時なのに8月上旬に延びるなど、グダグダな試験です。試験1ヶ月前に新しい試験範囲に対応した公式リファレンス出すのもどうなんでしょうね。

勉強雑感

さすがに公式リファレンスが全然見当違いなことを書いていることはないですが、公式ではない問題集にしても模擬試験にしても、それは問われるのか?ってことまで聞いていくるものもあって、そう思ったところは出ていないです。出るのかもしれないけどそれはかなり少数だと思われます。逆に「標準化」を応える問題は同一試験内で2回出た。
とはいえ合格者の話もあくまで受けた回の自分の出題のみ(CBTだから各自問題が異なる?)の話で、必ずしも参考にならない可能性もあるでしょう。

結局自分が受けたのは第2回で過去に試験は1回分しかないなかで、模擬の問題を作っているわけで、精度が高いとは思えません。
個人的にはPostgreSQL特有の記載とか、細かい機械学習のライブラリとかは出ないと思っています(問題集や模擬試験で出題)。まあExcelというか簡単なスプレッドシートレベルですがは把握が必要な問題はありましたが。
出ないとは言いませんが、細かいソフト・ライブラリの話を学び始めたら多岐にわたりすぎてしまうし、出ても数問捨てる方が良いようには思います(スキルチェックシートや公式リファレンスに明示されているものは除く)

データサイエンティスト検定(リテラシーレベル)の勉強内容

  • 公式リファレンスを読む(第一版)
    • 忘れていることは多々あれど、大体は一度は見聞きした内容だなと
  • アプリを解く
  • 問題集を解く
  • 模擬試験を解く(前日)
  • 公式リファレンスを高速で読む(前日夜)
  • スキルチェックシートを眺める(当日朝)

事前知識で差が出ると思います。機械学習なんてわからんって人がやっても大変だと思います。というかそういう人は試験がどうこうより機械学習を学んだほうが確実にデータサイエンスには役立つと思います。