スケーラブルデータサイエンス データエンジニアのための実践を読んだ

仕事で必要になって読んだ。僕は文字通りの学歴として通っていない数学があるので、この本を通して読むのはとても苦しいことだった。

僕が通っていた高校は進学校ではなく、商業高校の情報処理科だったので、端的には微積を通っていない。その代わり、簿記に詳しくなれたり、Excelに詳しくなれたのはこれまでの人生で利点がそれなりにあったから、そんなものだと思っている。

データサイエンスに取り組もうと思うと、高校数学くらいの話は当たり前の話として扱われるので、この本を読むにあたって数学の参考書を説いたり、Youtubeで高校数学をひたすら学んだりというのをやりつつ、リアルタイムデータ処理みたいな章以外をすべて写経もしくはサンプルコード実行した。

僕の学習パターンとして、写経というのはペパボに入ってからの一つの学習パターンとして身についている。最初はまるでなにもわからないのが、ただひたすら作者の足跡を真似するだけでなぜか物事が以前より理解できたり、クリアになったりすることが多くて、どうしようもない領域こそ写経する事が多い。

一方で、これまで仕事で扱っていた領域は大体これまでのスキルの延長線であったのでだいたいドキュメント読んだり、軽く触るだけで理解できていたが、一方でデータサイエンスの領域は自分の基礎学習から取り組む必要があり、それはモチベーションの意味で大きく苦痛を伴う作業だった。

一冊読み終えた今、たった一冊ではあったけどこれまでぼやっと遠くにみていた機械学習や、データエンジニアリングについて確実に自分の中で解像度が上がったように思うし、久しぶりにコンフォートゾーンから抜けれている気がしている。

取り組んでみてなお深みを目指したいかというとまだそこまではなっていないけど、ようやくスタート地点には立てたので、後何冊かあたってみて、その後、僕が出す実績にご期待ください。