- 2025年9月10日
オープンテーブル形式とは?初心者向けにわかりやすく解説!
こんばんわ!データクラウド研究所です! データ分析やAIの現場では「データレイク」や「データウェアハウス」といった言葉をよく耳にします。最近はその進化形として「レイクハウス」という考え方が広がり、その中で重要な役割を果たしているのが オープンテーブル […]
こんばんわ!データクラウド研究所です! データ分析やAIの現場では「データレイク」や「データウェアハウス」といった言葉をよく耳にします。最近はその進化形として「レイクハウス」という考え方が広がり、その中で重要な役割を果たしているのが オープンテーブル […]
こんにちは、データクラウドです!今回は「エンジニアにこそ必要な会計感覚」についてわかりやすく解説します。「会計なんて経理やマネージャーがやることでしょ?」と思う方もいるかもしれませんが、実はプロジェクトの成功やエンジニア自身の評価に直結する大切な要素 […]
こんにちわ、クラウドデータ研究所です。 前回の記事「PySpark超概要」では、PySparkがどのように大規模データを効率的に処理するかをざっくり説明しました。 データちゃん PysparkはSparkという分散処理技術をPythonで扱う為のAP […]
こんにちわ!研究所です。本日は、皆さんも毎日の生活で使用されているChatGPTについてみていきたいと思います! ChatGPTとは? ChatGPTは、OpenAIが開発した自然言語処理AIです。質問に答えるだけでなく、文章作成、アイデア出し、コー […]
はじめに 本記事では、GCP DataprocでのSparkクラスタ作成とPySparkジョブの実行を実際に行い、その手順と注意点を整理していきたいと思います。 Dataprocは、Apache SparkやHadoopなどのオープンソース分散処理フ […]