BigQuery UDF(JS)で色々やってみる
はじめに
今回はBigQuery UDFについて、少し調べてみたのでそれについて書いてみます。
cloud.google.com
Deltalakeのバージョニング機能を試してみる
はじめに
機械学習をプロダクションで行う場合、基本的にはMLOpsの枠組みに乗せてモデルを継続的に学習させ精度を向上、Keepしていくということが重要になるわけですが、一方であるときに使ったパラメータやデータセットの管理は結構手間です。
パラメータで言えばMLflowのようなものに記録すればいいのですが、データはコピーで持っておこうにもストレージ容量をコピー分食ってしまったりするため、ある程度慎重に設計する必要があります。
うーむ、と思っていたところ、Deltalakeをふと思い出しまして、とりあえず試してみるか、というのが本稿のモチベーションです。まずは浅く、どんなものか触ってみたという話をします。
【読書】スケーラブルデータサイエンス 第6章
はじめに
今回も引き続き、スケーラブルデータサイエンスです。
今日は第6章。Dataprocです。ちなみに、第5章は個人的によく知っている話題が多かったので記事としては取り上げません。
【読書】スケーラブルデータサイエンス 第4章
はじめに
今回も引き続き、スケーラブルデータサイエンスです。
今日は第4章。Apache Beamについて中心的にさわってみました。
【読書】スケーラブルデータサイエンス 第3章
はじめに
今回も引き続き、スケーラブルデータサイエンスです。
今日は第3章
【読書】スケーラブルデータサイエンス 第2章
はじめに
スケーラブルデータサイエンスを読み始めたので、読みつつ気になったところのまとめを実施していこうと思います。
まずは第2章のクラウドへのデータの取り込みです。