記事一覧
-
第5章
【0から学ぶAI】第134回:時系列データの前処理
前回の振り返り:欠損値の代入方法 前回は、データセットに欠損値が含まれる場合の対処法として、平均値、中央値、最頻値を使った代入方法について解説しました。それぞれの手法が持つ特徴や適用場面を説明し、欠損値が機械学習モデルに与える悪影響を防ぐ... -
第5章
【0から学ぶAI】第133回:欠損値の代入方法
前回の振り返り:SMOTEによるオーバーサンプリング 前回は、データの不均衡を解消するための効果的な手法であるSMOTE(Synthetic Minority Over-sampling Technique)について学びました。SMOTEは、少数クラスのデータを増加させる方法で、データセットの... -
第5章
【0から学ぶAI】第132回:SMOTEによるオーバーサンプリング
前回の振り返り:データの不均衡への対処 前回は、分類問題において、クラス間のデータの分布が偏っている場合に有効なサンプリング手法について解説しました。特に、少数クラスのデータ不足に対処するためのオーバーサンプリングと、多数クラスのデータを... -
第5章
【0から学ぶAI】第131回:データの不均衡への対処
前回の振り返り:次元削減の応用 前回は、データの次元削減手法であるt-SNEやUMAPを使って、高次元データを効率よく低次元に変換し、可視化やモデルの性能向上を図る方法について学びました。次元削減は、データの複雑な構造を把握しやすくし、モデルの過... -
第5章
【0から学ぶAI】第130回:次元削減の応用
前回の振り返り:特徴選択の手法 前回は、機械学習における重要な手法である特徴選択について学びました。特徴選択は、不要な特徴量を削除してモデルの性能を向上させるために行われます。フィルタ法、ラッパー法、組み込み法の3つの主要なアプローチがあ... -
第5章
【0から学ぶAI】第129回:特徴選択の手法
前回の振り返り:相関分析 前回は、相関分析について学びました。相関分析を通じて、データの特徴量同士や目的変数との関連性を数値で測定し、どの変数が重要な影響を持つかを明らかにしました。相関係数や相関行列を使ってデータを可視化することで、デー... -
第5章
【0から学ぶAI】第128回:相関分析
前回の振り返り:特徴量の生成 前回は、データから新しい情報を引き出すための特徴量生成について学びました。データの数学的操作やカテゴリデータのエンコード、日付データの分解など、さまざまな手法を活用して、モデルの性能を向上させるための新しい特... -
第5章
【0から学ぶAI】第127回:特徴量の生成
前回の振り返り:数値データのスケーリング 前回は、Min-Maxスケーリングや標準化について学びました。これらの手法を使うことで、データの範囲やばらつきを調整し、機械学習モデルの学習効率や性能を向上させることができました。スケーリングは、異なる... -
第5章
【0から学ぶAI】第126回:数値データのスケーリング
前回の振り返り:テキストデータの前処理 前回は、テキストデータを機械学習で扱いやすくするためのトークナイゼーションやステミング、レンマタイゼーションについて学びました。これらの手法を使うことで、自然言語データを適切に整形し、モデルに入力で... -
第5章
【0から学ぶAI】第125回:テキストデータの前処理
前回の振り返り:カテゴリ変数の扱い方 前回は、カテゴリ変数を数値に変換する方法であるラベルエンコーディングとワンホットエンコーディングについて解説しました。カテゴリデータは、数値と異なり、そのまま機械学習モデルに入力することができないため... -
第5章
【0から学ぶAI】第124回:カテゴリ変数の扱い方
前回の振り返り:データの分布と統計量 前回は、データの中心やばらつきを把握するための統計量について学びました。平均や中央値、標準偏差、分散などを使って、データの特性を数値的に理解し、ヒストグラムや箱ひげ図を用いて視覚的に把握する方法を解説... -
第5章
【0から学ぶAI】第123回:データの分布と統計量
前回の振り返り:異常値の検出 前回は、データ中の異常値を見つけ出すための手法を解説しました。ZスコアやIQR、ボックスプロットといった手法を使うことで、他のデータから大きく外れた異常値を視覚的かつ数値的に特定できることがわかりました。異常値は... -
第5章
【0から学ぶAI】第122回:異常値の検出
前回の振り返り:データの可視化 前回は、データを視覚的に理解するためのデータの可視化について解説しました。棒グラフや折れ線グラフ、散布図などの基本的な可視化手法を使うことで、データのパターンや傾向を直感的に把握できることがわかりました。デ... -
第5章
【0から学ぶAI】第121回:データの可視化
前回の振り返り:第4章のまとめと理解度チェック 前回は、第4章で学んだ内容を振り返り、理解を深めるための「まとめと理解度チェック」を行いました。ディープラーニングの基礎から、大規模言語モデル、自己教師あり学習、そしてトレンドや課題に至るまで... -
第4章
【0から学ぶAI】第119回:大規模言語モデルの課題
前回の振り返り:自己教師あり学習の進化 前回は、自己教師あり学習の最新の手法と、その進化について学びました。コントラスト学習やマスク付き自己回帰、BYOL、CLIPなど、ラベルなしデータを活用して効果的に学習する新しい手法が、データ収集のコスト削...
