Pythonでの画像認識入門
画像認識は、機械学習とコンピュータビジョンの一環として、非常に重要な分野です。Pythonは、その簡潔な文法と豊富なライブラリにより、プログラミング初心者にもおすすめの言語です。ここでは、Pythonで画像認識を始めるための基本的な手順を解説します。
必要なライブラリのインストール
まず、画像認識に必要なライブラリをインストールします。OpenCV、TensorFlow、およびKerasを使用します。以下のコマンドを実行してください。
pip install opencv-python tensorflow keras
画像の読み込みと表示
次に、画像を読み込み、表示する方法について説明します。OpenCV
を使用して画像を読み込み、表示します。
import cv2
import matplotlib.pyplot as plt
image = cv2.imread('example.jpg', cv2.IMREAD_COLOR)
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
plt.imshow(image)
plt.axis('off')
plt.show()
基本的な画像処理
さらに、いくつかの基本的な画像処理操作について学びましょう。例えば、画像のリサイズ、回転、そしてフィルタリングです。
以下のコードは、画像をリサイズし、回転させる方法を示しています。
resized_image = cv2.resize(image, (200, 200))
rotated_image = cv2.rotate(image, cv2.ROTATE_90_CLOCKWISE)
画像分類モデルの構築
次に、TensorFlowとKerasを使用してシンプルな画像分類モデルを構築します。以下は、簡単なニューラルネットワークを定義するコードです。
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, Flatten
model = Sequential([
Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
Flatten(),
Dense(128, activation='relu'),
Dense(10, activation='softmax')
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
モデルのコンパイルが完了したら、次はデータセットを用意して学習させます。MNIST
データセットを使用した例を以下に示します。
from tensorflow.keras.datasets import mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(-1, 28, 28, 1) / 255.0
x_test = x_test.reshape(-1, 28, 28, 1) / 255.0
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))
まとめ
以上、Pythonでの画像認識入門について解説しました。画像読み込み、基本的な画像処理、そして簡単な画像分類モデルの構築方法までをカバーしました。さらに詳しく知りたい方はこちら(外部リンク)をご覧ください。今後とも、Pythonでのプログラミングを楽しんでください。
John Doe“Learning image recognition with Python is a powerful step towards mastering machine learning.”