CATEGORY

データサイエンス

データサイエンスに関するトピックです。

  • 2025年8月30日

【入門】データ前処理とは?〜AIや分析の前に必ず通る下ごしらえ〜

「AIで未来を予測!」「データ分析で売上アップ!」と聞くと、なんだか華やかでかっこいい響きがありますよね。ところが実際に分析をやっている人に聞くと、「8割はデータ前処理に時間を使っている」とよく言われます。料理で例えれば、材料を切ったり、皮をむいたり […]

  • 2025年8月25日

超入門:PySparkでロジスティック回帰をやってみよう

こんにちは、クラウドデータ研究所です。 今回は「ロジスティック回帰」というものを見てみます。 難しそうな名前ですが、実は身近なところでよく使われている手法です。 データちゃん たとえば銀行が「この人はローンを返してくれるかな?」を予測したり、マーケテ […]

  • 2025年8月25日

【入門シリーズ】PySparkでクラスタリングを体験してみよう 〜Irisデータセットを使って〜

こんにちは、クラウドデータ研究所です。当ブログではこれまでに 重回帰 や ロジスティック回帰 など、PySparkを使った機械学習の手法を取り上げてきました。 今回はシリーズの一つとして、「クラスタリング」を紹介します。クラスタリングは「答え(ラベル […]

  • 2025年8月18日

超初心者向け|教師あり学習・教師なし学習・強化学習をクラウド活用例とあわせて解説

機械学習は、「コンピュータがデータをもとにパターンを学習し、新しいデータに対して予測や意思決定を行う技術」で、明示的にプログラムせずとも性能が向上するよう設計されたAIの一分野です。「AI」は広義な概念ですが、現代のAIと呼ばれる技術の多くはこの機械 […]

  • 2025年8月12日

データ可視化(Data Visualization)とは?直観で理解し、意思決定を加速する技術

大量かつ複雑なデータを扱う中で、データ可視化 は理解を促進し、意思決定の質とスピードを大幅に高める重要なスキルです。特にデータサイエンティストや経営層への成果報告において不可欠です。 データ可視化とは データ可視化とは「数値や分類情報などをグラフや図 […]