- 2025年9月7日
データ分析・活用領域の最新技術動向と今後の展望
現在注目されている技術動向 大規模言語モデル(LLM)の活用拡大 近年、大規模言語モデル(LLM: Large Language Model)が各業界で大きな注目を集めています。LLMは膨大なテキストデータから学習したAIモデルで、人間のように文章を […]
クラウド・データ基盤に関するトピックになります。 – クラウド概念(IaaS / PaaS / SaaS) – 各クラウド比較(AWS, GCP, Azure) – ネットワーク / セキュリティ基盤
現在注目されている技術動向 大規模言語モデル(LLM)の活用拡大 近年、大規模言語モデル(LLM: Large Language Model)が各業界で大きな注目を集めています。LLMは膨大なテキストデータから学習したAIモデルで、人間のように文章を […]
サーバーを立てる、ネットワークをつなぐ、データベースを用意する。こうした「インフラの準備」は昔から大変な仕事でした。IT担当者が夜中にデータセンターに駆けつけて、ケーブルを差し替えたり、設定画面をぽちぽち操作したりする光景。ドラマや映画でもよく見かけ […]
AIを活用する上で、最近よく耳にする MCP(Model Context Protocol)。「新しいAPIの一種?」と思う方も多いかもしれません。 実はMCPは、従来のAPI連携を大きく変える可能性を秘めた “AI時代のUSB-C” と呼べる存在で […]
データ分析の現場では、「ノーコードで素早くETLを形にする」ことがますます重要になっています。GCP の Cloud Data Fusion は、GUI 上でソース接続・変換・ロードまでをつなぐことで、SQL やスクリプトを書かずに 実運用レベルのデ […]
こんにちは、クラウドデータ研究所です。 今回は「ロジスティック回帰」というものを見てみます。 難しそうな名前ですが、実は身近なところでよく使われている手法です。 データちゃん たとえば銀行が「この人はローンを返してくれるかな?」を予測したり、マーケテ […]
こんにちは、クラウドデータ研究所です。当ブログではこれまでに 重回帰 や ロジスティック回帰 など、PySparkを使った機械学習の手法を取り上げてきました。 今回はシリーズの一つとして、「クラスタリング」を紹介します。クラスタリングは「答え(ラベル […]
ビッグデータ時代と呼ばれて久しい今日、企業や研究機関では膨大な量のデータを扱うことが当たり前になっています。 しかし、通常のPCや1台のサーバーで処理できるデータ量には限界があります。そこで登場するのが「分散処理」という考え方です。複数のコンピュータ […]
そもそもデータフレームって何だろう? データフレーム(DataFrame)は、表形式のデータを扱うためのデータ構造です。 Excelの表をイメージすると理解しやすいです。 データ分析の世界では「必須アイテム」といえる存在です。 Pythonとデータフ […]
そもそもAPIってなに? API(エーピーアイ)は Application Programming Interface の略で、日本語では「アプリケーションとアプリケーションをつなぐ窓口」と言えます。ちょっと難しく聞こえますが、要は「プログラム同士を […]
そもそもSnowflakeとは? Snowflakeはクラウドネイティブなデータウェアハウスで、AWS・Azure・GCPなど複数のクラウド環境上で利用可能なサービスです。従来のオンプレミス型データベースとは異なり、ストレージとコンピューティングを完 […]