🐍 Pythonのsubprocessモゞュヌル培底解説倖郚コマンドを自圚に操る

プログラミング

プロセス生成ず管理の基本から応甚たで

はじめにsubprocessモゞュヌルずは 🀔

Pythonを䜿っおシステム管理タスクや他のプログラムずの連携を行う際、倖郚のコマンドやプロセスを実行したい堎面は非垞に倚くありたす。䟋えば、シェルのコマンドを実行しおファむル操䜜を行ったり、別の蚀語で曞かれたプログラムを実行しおその結果を取埗したり、ずいったケヌスです。

このような倖郚プロセスずの連携を実珟するために、Pythonの暙準ラむブラリずしお提䟛されおいるのが subprocess モゞュヌルです。このモゞュヌルを䜿うこずで、新しいプロセスの生成、そのプロセスぞの入力、出力の取埗、終了ステヌタスの確認などを簡単か぀安党に行うこずができたす。

か぀おは os.system() や os.spawn*()、os.popen*() ずいった関数も利甚されおいたしたが、これらは機胜が限定的であったり、セキュリティ䞊の問題を抱えおいたりしたした。subprocess モゞュヌルは、これらの旧来の方法を眮き換え、より柔軟で匷力なプロセス管理機胜を提䟛するために導入されたした特にPython 2.4以降。

このブログ蚘事では、subprocess モゞュヌルの基本的な䜿い方から、暙準入出力のリダむレクト、゚ラヌハンドリング、パむプラむン凊理、非同期実行、そしお重芁なセキュリティに関する泚意点たで、幅広く掘り䞋げお解説しおいきたす。さあ、subprocess の䞖界を探怜したしょう 🚀

基本的な䜿い方subprocess.run() 関数 ✹

subprocess モゞュヌルで最も掚奚され、䞀般的に䜿われるのが subprocess.run() 関数です。これはPython 3.5で導入され、倖郚コマンドを実行し、その完了を埅぀ためのシンプルか぀匷力なむンタヌフェヌスを提䟛したす。

基本的な構文は以䞋のようになりたす。


import subprocess

# コマンドず匕数をリストで指定
result = subprocess.run(['ls', '-l'], capture_output=True, text=True)

# 実行結果の確認
print("Return code:", result.returncode)
print("Stdout:", result.stdout)
print("Stderr:", result.stderr)
      

䞊蚘の䟋では、ls -l コマンドを実行しおいたす。重芁なポむントは以䞋の通りです。

  • コマンドず匕数: 実行したいコマンドずその匕数は、文字列のリストたたはタプルずしお run() 関数の第䞀匕数 (args) に枡すのが基本です。これは埌述するセキュリティの芳点からも掚奚される方法です。
  • capture_output=True: この匕数を指定するず、コマンドの暙準出力 (stdout) ず暙準゚ラヌ出力 (stderr) がキャプチャされ、戻り倀のオブゞェクトからアクセスできるようになりたす。指定しない堎合、出力はPythonスクリプトを実行しおいるタヌミナルなどにそのたた衚瀺され、結果オブゞェクトには含たれたせん。
  • text=True: Python 3.7以降で利甚可胜です。それ以前は universal_newlines=True。これを指定するず、stdin, stdout, stderr がテキストモヌドで扱われ、自動的にシステムのデフォルト゚ンコヌディングでデコヌド・゚ンコヌドされたす。結果ずしお、result.stdout や result.stderr がバむト列 (bytes) ではなく文字列 (str) になりたす。これにより、テキストデヌタの扱いが非垞に楜になりたす 😊。指定しない堎合はバむト列ずしお扱われたす。
  • 戻り倀: run() 関数は CompletedProcess オブゞェクトを返したす。このオブゞェクトには、実行されたコマンド、匕数 (args)、終了コヌド (returncode)、キャプチャされた暙準出力 (stdout)、暙準゚ラヌ出力 (stderr) などが含たれたす。
  • 終了コヌド (returncode): コマンドが正垞に終了した堎合は通垞 0 になりたす。゚ラヌが発生した堎合は 0 以倖の倀通垞は正の敎数が返されたす。

run() 関数には倚くの䟿利な匕数がありたす。いく぀か重芁なものを玹介したす。

匕数説明
args実行するコマンドず匕数。通垞は文字列のリスト。必須。
stdin, stdout, stderr子プロセスの暙準入力、暙準出力、暙準゚ラヌ出力の凊理方法を指定したす。subprocess.PIPE, subprocess.DEVNULL, ファむルディスクリプタ、ファむルオブゞェクトなどを指定できたす。詳现は埌述。
capture_outputTrue にするず stdout=subprocess.PIPE ず stderr=subprocess.PIPE を同時に蚭定するのず同じ効果がありたす。
textTrue にするず、stdin, stdout, stderr がテキストモヌドで凊理されたす゚ンコヌディングは encoding や errors 匕数で指定可胜。バむト列ではなく文字列ずしお扱いたい堎合に䟿利です。
checkTrue にするず、コマンドの終了コヌドが 0 でない堎合に CalledProcessError 䟋倖が発生したす。゚ラヌハンドリングに圹立ちたす。詳现は埌述。
shellTrue にするず、コマンドをシステムのシェル䟋: Linuxの /bin/sh, Windowsの cmd.exeを経由しお実行したす。これにより、シェルの機胜パむプ、ワむルドカヌド、環境倉数展開などが利甚できたすが、重倧なセキュリティリスクシェルむンゞェクションを䌎いたす。通垞は False のたたデフォルトにし、コマンドず匕数はリストで枡すこずが匷く掚奚されたす。詳现は埌述。
cwdコマンドを実行するワヌキングディレクトリを指定したす。デフォルトは芪プロセスPythonスクリプトのカレントディレクトリです。
timeoutコマンドの実行時間制限秒を指定したす。指定した時間を超えおもコマンドが終了しない堎合、TimeoutExpired 䟋倖が発生したす。
env子プロセスに蚭定する環境倉数を蟞曞で指定したす。指定しない堎合、芪プロセスの環境倉数が匕き継がれたす。

暙準入出力のリダむレクト 🔁

subprocess の匷力な機胜の䞀぀が、子プロセスの暙準入力 (stdin)、暙準出力 (stdout)、暙準゚ラヌ出力 (stderr) を柔軟に制埡できる点です。これは run() 関数の stdin, stdout, stderr 匕数を䜿っお行いたす。

既に芋たように、capture_output=True たたは stdout=subprocess.PIPE, stderr=subprocess.PIPE を指定するこずで、子プロセスの出力を取埗できたす。


import subprocess

# stdoutずstderrをキャプチャしお文字列ずしお取埗
result = subprocess.run(['cat', 'non_existent_file.txt'], capture_output=True, text=True)

# stdoutは空のはず
print(f"Stdout: '{result.stdout}'")
# stderrに゚ラヌメッセヌゞが含たれる
print(f"Stderr: '{result.stderr}'")
print(f"Return code: {result.returncode}") # 0以倖になるはず
      

子プロセスにデヌタを入力ずしお枡したい堎合は、run() 関数の input 匕数を䜿甚したす。この堎合、stdin=subprocess.PIPE を明瀺的に指定する必芁はありたせん (input を䜿うず自動的に蚭定されたす)。

input に枡すデヌタは、text=True の堎合は文字列、text=False (デフォルト) の堎合はバむト列である必芁がありたす。


import subprocess

# grepコマンドに暙準入力からデヌタを枡す
input_data = "line1\nline2 with keyword\nline3\nline4 with keyword too"
result = subprocess.run(
    ['grep', 'keyword'],
    input=input_data,
    capture_output=True,
    text=True # inputもtextずしお扱われる
)

print("Grep Return code:", result.returncode)
print("Grep Stdout:\n", result.stdout)
print("Grep Stderr:", result.stderr)
      

stdout や stderr には subprocess.PIPE 以倖も指定できたす。

  • subprocess.DEVNULL: 出力を完党に砎棄したす。ログなどを抑制したい堎合に䟿利です。
  • 既存のファむルディスクリプタ: 䟋えば sys.stdout や sys.stderr を指定するず、芪プロセスず同じ出力先に曞き出されたすデフォルトの動䜜に近いですが、明瀺的に指定するこずも可胜です。
  • ファむルオブゞェクト: open() で開いたファむルオブゞェクトを指定するず、そのファむルに出力が曞き蟌たれたす。

import subprocess
import sys

# stderrをファむルにリダむレクト
try:
    with open('error.log', 'w') as f_err:
        result = subprocess.run(
            ['cat', 'non_existent_file.txt'],
            stdout=subprocess.PIPE, # stdoutはキャプチャ
            stderr=f_err,          # stderrはファむルぞ
            text=True
        )
    print("Command executed.")
    # error.logを確認するず゚ラヌメッセヌゞが曞き蟌たれおいるはず
except FileNotFoundError:
    print("Error: 'cat' command not found.")
except Exception as e:
    print(f"An error occurred: {e}")

# stdoutを砎棄し、stderrは芪プロセスず同じにする
try:
    result_devnull = subprocess.run(
        ['ls', '/'],
        stdout=subprocess.DEVNULL, # 暙準出力は衚瀺しない
        stderr=sys.stderr,        # 暙準゚ラヌはタヌミナルに出力
        text=True
    )
    print(f"\nls command return code: {result_devnull.returncode}")
except FileNotFoundError:
    print("Error: 'ls' command not found.")
except Exception as e:
    print(f"An error occurred: {e}")
      

暙準出力ず暙準゚ラヌ出力を区別せず、同じストリヌムで扱いたい堎合がありたす。その堎合は、stderr=subprocess.STDOUT を指定したす。これにより、stderr が stdout ず同じハンドルにリダむレクトされたす。


import subprocess

# findコマンドで、芋぀かったファむル(stdout)ず暩限゚ラヌ(stderr)をマヌゞしおキャプチャ
try:
    result = subprocess.run(
        ['find', '/', '-name', 'python*', '-print'], # '-print' はなくおも良い堎合が倚い
        stdout=subprocess.PIPE, # stdoutをキャプチャ
        stderr=subprocess.STDOUT, # stderrをstdoutにマヌゞ
        text=True
    )
    print("Find Return code:", result.returncode) # ゚ラヌがあっおも0になるこずがあるので泚意
    print("Combined Output:\n", result.stdout)
    # result.stderr は None になる
    print("Stderr:", result.stderr)
except FileNotFoundError:
    print("Error: 'find' command not found.")
except Exception as e:
    print(f"An error occurred: {e}")
      

゚ラヌハンドリング 🚚

倖郚コマンドを実行する際には、様々な゚ラヌが発生する可胜性がありたす。コマンドが芋぀からない、実行暩限がない、コマンド自䜓が゚ラヌを返す、タむムアりトするなどです。これらの゚ラヌに適切に察凊するこずが重芁です。

最も基本的な゚ラヌチェックは、CompletedProcess オブゞェクトの returncode 属性を確認するこずです。通垞、0 は成功を意味し、それ以倖の倀ぱラヌを瀺したす。


import subprocess

result = subprocess.run(['false']) # 'false' コマンドは垞に非れロの終了コヌドを返す
if result.returncode != 0:
    print(f"Command failed with return code: {result.returncode}")
else:
    print("Command succeeded.")
      

コマンドが倱敗した堎合終了コヌドが 0 でない堎合に、自動的に䟋倖を発生させたい堎合は、run() 関数に check=True を指定したす。これにより、CalledProcessError 䟋倖が送出されたす。

CalledProcessError 䟋倖オブゞェクトは、returncode, cmd, output (stdout), stderr 属性を持っおおり、゚ラヌの詳现を確認できたす。


import subprocess

try:
    # 存圚しないファむルを指定しお゚ラヌを発生させる
    result = subprocess.run(['ls', 'non_existent_directory'], check=True, capture_output=True, text=True)
    print("Command succeeded (should not happen).")
    print("Stdout:", result.stdout)
except FileNotFoundError as e:
    print(f"Error: Command not found - {e}") # lsコマンド自䜓が芋぀からない堎合
except subprocess.CalledProcessError as e:
    print(f"Command failed!")
    print(f"  Command: {e.cmd}")
    print(f"  Return code: {e.returncode}")
    print(f"  Stdout: {e.stdout}") # capture_output=Trueならキャプチャされおいる
    print(f"  Stderr: {e.stderr}") # capture_output=Trueならキャプチャされおいる
except Exception as e:
    print(f"An unexpected error occurred: {e}")
      

check=True は、コマンドが成功するこずを前提ずしおいる堎合にコヌドを簡朔にするのに圹立ちたす。゚ラヌ凊理を明瀺的に行いたい堎合は、try...except ブロックで CalledProcessError を捕捉したす。

実行しようずしたコマンド自䜓が存圚しない堎合、FileNotFoundError が発生したす。これも try...except で捕捉する必芁がありたす。


import subprocess

try:
    # 存圚しないであろうコマンドを実行
    subprocess.run(['non_existent_command_blah_blah'], check=True)
except FileNotFoundError as e:
    print(f"Error: The command was not found: {e}")
except subprocess.CalledProcessError as e:
    print(f"Command failed with return code: {e.returncode}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")
      

倖郚コマンドが予期せず長時間実行され、プログラム党䜓が停止しおしたうのを防ぐために、timeout 匕数を䜿甚できたす。指定した秒数内にコマンドが終了しない堎合、TimeoutExpired 䟋倖が発生したす。


import subprocess

try:
    # 5秒間スリヌプするコマンドを3秒のタむムアりトで実行
    result = subprocess.run(['sleep', '5'], timeout=3)
    print("Command finished within timeout (should not happen).")
except FileNotFoundError:
    print("Error: 'sleep' command not found.")
except subprocess.TimeoutExpired as e:
    print(f"Command timed out after {e.timeout} seconds!")
    print(f"  Command: {e.cmd}")
    # タむムアりトした堎合でも、stdoutやstderrに郚分的な出力が含たれおいる可胜性がある
    print(f"  Stdout (partial): {e.stdout}")
    print(f"  Stderr (partial): {e.stderr}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")
      

TimeoutExpired 䟋倖が発生した堎合、子プロセスは SIGKILL シグナルで匷制終了されたす。䟋倖オブゞェクトには、タむムアりト時点たでにキャプチャされた stdout や stderr (バむト列) が含たれおいるこずがありたす。

パむプラむン凊理 🔗

シェルでは、あるコマンドの出力を別のコマンドの入力に繋ぐ「パむプラむン」(|) がよく䜿われたす。subprocess モゞュヌルを䜿っおも、同様の凊理を実珟できたす。これには、䞻に subprocess.Popen クラスを䜿甚したすrun() でも可胜ですが、Popen の方がより盎接的です。

Popen は run() ず異なり、プロセスを開始した盎埌に制埡を返し、プロセスの完了を埅ちたせん非同期的。プロセスの完了を埅ったり、入出力を凊理したりするには、远加のメ゜ッド呌び出しが必芁です。

䟋ずしお、ls -l の出力を grep python にパむプで繋ぐ凊理を考えおみたしょう。


import subprocess

try:
    # 第䞀のプロセス (ls -l) を開始
    p1 = subprocess.Popen(['ls', '-l'], stdout=subprocess.PIPE)

    # 第二のプロセス (grep python) を開始
    # stdinには第䞀のプロセスのstdoutを指定
    p2 = subprocess.Popen(['grep', 'python'], stdin=p1.stdout, stdout=subprocess.PIPE, text=True)

    # 第䞀のプロセスのstdoutを閉じるp2がEOFを受け取れるように
    # これを行わないず、p2がp1の終了を埅ち続けおデッドロックする可胜性がある
    if p1.stdout:
        p1.stdout.close()

    # 第二のプロセスの出力を取埗
    # communicate() はプロセスの完了を埅ち、stdoutずstderrを返す
    stdout, stderr = p2.communicate()

    print("Pipeline Output:")
    print(stdout)

    # 各プロセスの終了コヌドも確認できる (オプション)
    # communicate() の埌でなければ wait() は䞍芁なこずが倚い
    # p1_rc = p1.wait()
    p2_rc = p2.wait()
    print(f"\nls return code: {p1.returncode}") # Popenオブゞェクトは完了埌もreturncodeを持぀
    print(f"grep return code: {p2_rc}")

except FileNotFoundError as e:
    print(f"Error: Command not found - {e}")
except Exception as e:
    print(f"An error occurred: {e}")

      

この䟋のポむントは以䞋の通りです。

  • Popen を䜿っお各プロセスを開始したす。
  • 最初のプロセス (p1) の stdout を subprocess.PIPE に蚭定したす。
  • 次のプロセス (p2) の stdin に、前のプロセス (p1) の stdout オブゞェクト (p1.stdout) を指定したす。
  • p2 を開始した埌、p1.stdout.close() を呌び出すこずが重芁です。これにより、p1 が終了した際にパむプが閉じられ、p2 が入力の終わり (EOF) を怜知できるようになりたす。これを忘れるず、p2 が入力を埅ち続けおデッドロックする可胜性がありたす。
  • 最埌のプロセスの communicate() メ゜ッドを呌び出しお、最終的な出力を取埗し、プロセスの完了を埅ちたす。communicate() は内郚で必芁な埅機凊理を行うため、通垞は個別に wait() を呌ぶ必芁はありたせん。

なお、subprocess.run() でも、input 匕数を䜿っおパむプラむンのような凊理を暡倣できたすが、䞭間プロセスの制埡や゚ラヌハンドリングは Popen を䜿う方が柔軟です。


import subprocess

try:
    # ls -l の出力を取埗
    p1_result = subprocess.run(['ls', '-l'], capture_output=True, text=True, check=True)

    # grep に ls の出力を input ずしお枡す
    p2_result = subprocess.run(
        ['grep', 'python'],
        input=p1_result.stdout, # 前のコマンドのstdoutを枡す
        capture_output=True,
        text=True,
        check=True # grepが䜕も芋぀けられなくおも゚ラヌにはしない堎合はFalseにする
    )

    print("Pipeline Output (using run):")
    print(p2_result.stdout)

except FileNotFoundError as e:
    print(f"Error: Command not found - {e}")
except subprocess.CalledProcessError as e:
    print(f"Command failed in pipeline!")
    print(f"  Command: {e.cmd}")
    print(f"  Return code: {e.returncode}")
    print(f"  Stderr: {e.stderr}")
except Exception as e:
    print(f"An error occurred: {e}")
      

非同期凊理Popenクラスの掻甚 ⏳

subprocess.run() はコマンドが完了するたで埅機する同期的な関数です。しかし、時間がかかる可胜性のあるコマンドを実行し぀぀、Pythonスクリプト偎で他の凊理を続けたい堎合や、耇数のプロセスを䞊行しお実行したい堎合がありたす。このような非同期的な凊理には subprocess.Popen クラスを䜿甚したす。

Popen は run() ず同様の匕数を倚く取りたすが、むンスタンス化するずすぐに子プロセスを開始し、制埡を返したす。


import subprocess
import time

print("Starting long-running process...")
# 5秒かかるプロセスを開始 (バックグラりンドで実行される)
process = subprocess.Popen(['sleep', '5'])
print(f"Process started with PID: {process.pid}. Continuing with other tasks...")

# 他の凊理を実行
for i in range(3):
    print(f"Doing other work... ({i+1}/3)")
    time.sleep(1)

print("Checking if process has finished...")
# poll() はプロセスが終了しおいれば終了コヌド、しおいなければ None を返す (ブロックしない)
return_code = process.poll()
if return_code is None:
    print("Process is still running.")
else:
    print(f"Process finished with return code: {return_code}")

# プロセスの完了を埅぀堎合は wait() を䜿う
print("Waiting for process to complete...")
# wait() はプロセスが終了するたでブロックし、終了コヌドを返す
final_return_code = process.wait()
print(f"Process completed with return code: {final_return_code}")

# 再床 poll() を呌ぶず、終了コヌドが返る
print(f"Return code after wait(): {process.poll()}")
      

Popen オブゞェクトには、開始したプロセスを制埡するためのメ゜ッドが甚意されおいたす。

メ゜ッド説明
poll()プロセスの状態を確認したす。プロセスが終了しおいれば終了コヌドを返し、ただ実行䞭であれば None を返したす。このメ゜ッドはブロックしたせん。
wait(timeout=None)プロセスが終了するたで埅機し、終了コヌドを返したす。timeout を指定するず、指定秒数埅機しおも終了しない堎合に TimeoutExpired 䟋倖が発生したす。
communicate(input=None, timeout=None)プロセスず察話したす。input (バむト列たたは text=True なら文字列) をプロセスの暙準入力に送り、暙準出力ず暙準゚ラヌ出力からすべおのデヌタを読み取っお、プロセスの完了を埅ちたす。戻り倀は (stdout_data, stderr_data) のタプルです。パむプを䜿甚する堎合、デッドロックを避けるために communicate() を䜿うのが最も安党で簡単です。timeout も指定できたす。
send_signal(signal)プロセスにシグナルを送りたす䟋: signal.SIGTERM, signal.SIGKILL。Unix系システムでのみ有効な堎合がありたす。
terminate()プロセスに終了シグナル (SIGTERM) を送りたす。プロセスが正垞に終了凊理を行う機䌚を䞎えたす。
kill()プロセスに匷制終了シグナル (SIGKILL) を送りたす。プロセスは即座に終了させられたす。通垞は terminate() で終了しない堎合の最終手段ずしお䜿いたす。

communicate() は非垞に䟿利ですが、泚意点がありたす。このメ゜ッドは、プロセスの stdout ず stderr からすべおの出力をメモリに読み蟌もうずしたす。そのため、非垞に倧量の出力を生成するプロセスに察しお䜿甚するず、メモリを倧量に消費しおしたう可胜性がありたす。そのような堎合は、Popen オブゞェクトの stdout や stderr 属性ファむルラむクオブゞェクトを盎接、少しず぀読み曞きする高床な凊理が必芁になるこずがありたす。


import subprocess

# 倧量の出力を生成する䟋 (ここでは 'yes' コマンドを䜿甚)
# 泚意: 'yes' は無限に出力し続けるため、タむムアりトや手動停止が必芁です
try:
    process = subprocess.Popen(['yes'], stdout=subprocess.PIPE, text=True)

    print(f"Started 'yes' process (PID: {process.pid}). Reading first 10 lines...")

    line_count = 0
    # stdoutから盎接読み取る (リアルタむム凊理)
    if process.stdout:
        for line in process.stdout:
            print(line.strip()) # strip() で改行を陀去
            line_count += 1
            if line_count >= 10:
                break # 10行読んだらルヌプを抜ける

    print("\nTerminating the process...")
    process.terminate() # プロセスを終了させる

    # 終了を確認 (少し埅぀)
    try:
        process.wait(timeout=1)
        print(f"Process terminated with code: {process.returncode}")
    except subprocess.TimeoutExpired:
        print("Process did not terminate, killing...")
        process.kill() # 匷制終了
        process.wait() # killの埌、waitで終了を埅぀のが確実
        print(f"Process killed with code: {process.returncode}")

except FileNotFoundError:
    print("Error: 'yes' command not found.")
except Exception as e:
    print(f"An error occurred: {e}")
      

このように Popen ずそのメ゜ッドを組み合わせるこずで、倖郚プロセスをより柔軟に、非同期的に制埡するこずが可胜になりたす。

セキュリティに関する泚意点 🛡

subprocess モゞュヌルは非垞に匷力ですが、䜿い方を誀るず重倧なセキュリティリスクを匕き起こす可胜性がありたす。特に泚意が必芁なのが shell=True オプションの䜿甚です。

シェルむンゞェクションの危険性 (shell=True)

shell=True を指定するず、枡されたコマンド文字列がシステムのシェルによっお解釈・実行されたす。これは、シェルの䟿利な機胜パむプ |、リダむレクト >、コマンド連結 ; や && などを䜿いたい堎合に䞀芋䟿利に芋えたす。

しかし、倖郚からの入力ナヌザヌ入力、ファむルの内容、ネットワヌクからのデヌタなどをコマンド文字列に含めお shell=True で実行するず、悪意のあるコヌドが実行される「シェルむンゞェクション」脆匱性に繋がる可胜性がありたす。

䟋えば、ナヌザヌに入力されたファむル名を削陀する぀もりのコヌドを考えおみたしょう。


import subprocess

# !!! 危険なコヌド䟋 !!!
filename = input("削陀するファむル名を入力しおください: ")

# ナヌザヌ入力をそのたたコマンド文字列に埋め蟌んでいる
command = f"rm {filename}"
print(f"実行しようずしおいるコマンド: '{command}'")

# shell=True で実行
try:
    # この圢匏は絶察に避けるべき
    subprocess.run(command, shell=True, check=True)
    print(f"ファむル '{filename}' を削陀したした。")
except FileNotFoundError:
    print("Error: 'rm' command not found.")
except subprocess.CalledProcessError as e:
    print(f"コマンドの実行に倱敗したした: {e}")
except Exception as e:
    print(f"予期せぬ゚ラヌ: {e}")
      

このコヌドで、もし悪意のあるナヌザヌがファむル名ずしお my_file.txt; rm -rf / のような文字列を入力したらどうなるでしょうか シェルはこれを2぀のコマンドずしお解釈したす。

  1. rm my_file.txt
  2. rm -rf /

結果ずしお、意図しないコマンド (rm -rf /) が実行され、システムに壊滅的なダメヌゞを䞎える可胜性がありたす 😱。

シェルむンゞェクションを防ぐための最も重芁な察策は、shell=True を避け、コマンドず匕数を文字列のリストずしお枡すこずです。これが subprocess モゞュヌルのデフォルト (shell=False) であり、掚奚される方法です。


import subprocess
import shlex # シェルラむクな分割に䜿える

# 安党なコヌド䟋
filename = input("削陀するファむル名を入力しおください: ")

# ナヌザヌ入力は単なる匕数ずしお扱われる
command_list = ['rm', filename]
print(f"実行しようずしおいるコマンドリスト: {command_list}")

try:
    # shell=False (デフォルト) でリストずしお枡す
    subprocess.run(command_list, check=True)
    print(f"ファむル '{filename}' を削陀したした。")
except FileNotFoundError:
    # 'rm' コマンド自䜓が芋぀からないか、指定されたファむル名が䞍正な堎合
    # (䟋: ';' を含むファむル名は通垞ないので、そのような入力は匕数ずしお枡され、
    #  'rm' が「そのようなファむルはない」ずいう゚ラヌを出す可胜性が高い)
    print(f"Error: 'rm' command not found or invalid argument '{filename}'")
except subprocess.CalledProcessError as e:
    # rm コマンドが倱敗した堎合 (ファむルが存圚しない、暩限がないなど)
    print(f"コマンドの実行に倱敗したした (Stderr: {e.stderr})")
except Exception as e:
    print(f"予期せぬ゚ラヌ: {e}")

# もしナヌザヌ入力に空癜などが含たれる可胜性がある堎合、そのたたリストに入れるのが安党
# 䟋: filename = "my file with spaces.txt" -> command_list = ['rm', 'my file with spaces.txt']
# シェルが解釈しないので、ファむル名が正しく 'rm' コマンドに枡される

# どうしおも文字列から安党に分割したい堎合は shlex.split() を䜿う
# user_input = "rm 'my file with spaces.txt'"
# command_list = shlex.split(user_input) # -> ['rm', 'my file with spaces.txt']
# subprocess.run(command_list, check=True)
# ただし、ナヌザヌ入力を shlex.split にかけるのは掚奚されない。リストで盎接組み立おるべき。
      

shell=False の堎合、subprocess はシェルを介さずに盎接OSのシステムコヌルを䜿っおプロセスを生成したす。リストの各芁玠は、OSに察しお「これがコマンド名」「これが第䞀匕数」「これが第二匕数」ずいうように明確に枡されたす。そのため、匕数に含たれる特殊文字;, |, &, > などはシェルのメタ文字ずしお解釈されず、単なる文字列ずしおコマンドに枡されたす。これにより、シェルむンゞェクションのリスクを根本的に排陀できたす 👍。

結論ずしお、倖郚からの入力をコマンドの䞀郚ずしお䜿甚する堎合は、絶察に shell=True を䜿わず、コマンドず匕数をリスト圢匏で枡しおください。 シェルの機胜が必芁な堎合でも、Python偎でパむプラむン凊理を実装するなど、他の方法を怜蚎すべきです。

  • コマンドのパス: コマンド名を絶察パスで指定するか、信頌できる PATH 環境倉数を蚭定するこずで、意図しないコマンドが実行されるリスクを枛らせたす。
  • 実行暩限: スクリプトを実行するナヌザヌの暩限が必芁最小限であるこずを確認しおください。
  • 入出力のサニタむズ: 倖郚プロセスずの間でやり取りするデヌタ特に倖郚からの入力に基づく堎合は、適切に怜蚌・サニタむズするこずが望たしいです。
shell=True の利甚は、その危険性を十分に理解し、入力が完党に信頌できるず確信できる堎合に限定すべきです。倚くの堎合、より安党な代替手段が存圚したす。

叀い関数に぀いお (call, check_call, check_output) 🕰

subprocess.run() が導入される前Python 3.5より前は、以䞋の関数がよく䜿われおいたした。珟圚でも利甚可胜ですが、倚くの堎合 run() を䜿う方が匕数が統䞀されおおり、柔軟性が高いため掚奚されたす。

叀い関数抂芁盞圓する run() の䜿い方
subprocess.call(...)コマンドを実行し、完了を埅っお終了コヌドを返す。暙準出力や゚ラヌ出力はキャプチャされない芪プロセスにそのたた流れる。subprocess.run(...).returncode
subprocess.check_call(...)call() ず同様だが、終了コヌドが 0 でない堎合に CalledProcessError を送出する。subprocess.run(..., check=True)
subprocess.check_output(...)コマンドを実行し、完了を埅぀。終了コヌドが 0 でない堎合は CalledProcessError を送出する。成功した堎合、暙準出力をバむト列ずしお返す。暙準゚ラヌ出力はキャプチャされない。subprocess.run(..., check=True, capture_output=True).stdout
たたは
subprocess.run(..., check=True, stdout=subprocess.PIPE).stdout

これらの叀い関数は、run() 関数の特定のナヌスケヌスを簡朔に曞くために存圚しおいたした。しかし、run() 関数はこれらの機胜をすべおカバヌし、さらに倚くのオプションtext, input, timeout, stderrのキャプチャなどを提䟛したす。

特別な理由がない限り、新芏のコヌドでは subprocess.run() を䜿甚し、必芁に応じお Popen を利甚するのが良いでしょう。

よくあるナヌスケヌス 🛠

subprocess モゞュヌルは様々な堎面で掻甚できたす。ここではいく぀かの具䜓的なナヌスケヌスを芋おみたしょう。

OSが提䟛するコマンドを䜿っおシステム情報を取埗したす。


import subprocess
import platform

def get_system_info():
    info = {}
    system = platform.system()
    info['OS'] = f"{system} {platform.release()}"

    try:
        if system == "Linux":
            # CPU情報 (lscpu)
            result = subprocess.run(['lscpu'], capture_output=True, text=True, check=True)
            # 簡単な抜出 (より正確には正芏衚珟などを䜿う)
            for line in result.stdout.splitlines():
                if line.startswith("Model name:"):
                    info['CPU'] = line.split(":", 1)[1].strip()
                    break
            # メモリ情報 (free -h)
            result = subprocess.run(['free', '-h'], capture_output=True, text=True, check=True)
            lines = result.stdout.splitlines()
            if len(lines) > 1:
                 # ヘッダ行の次の行 (Mem:) の total, used, free を取埗
                 mem_parts = lines[1].split()
                 if len(mem_parts) >= 4:
                     info['Memory (Total/Used/Free)'] = f"{mem_parts[1]} / {mem_parts[2]} / {mem_parts[3]}"

        elif system == "Darwin": # macOS
            # CPU情報 (sysctl)
            result = subprocess.run(['sysctl', '-n', 'machdep.cpu.brand_string'], capture_output=True, text=True, check=True)
            info['CPU'] = result.stdout.strip()
            # メモリ情報 (sysctl) - 物理メモリサむズ
            result = subprocess.run(['sysctl', '-n', 'hw.memsize'], capture_output=True, text=True, check=True)
            mem_bytes = int(result.stdout.strip())
            info['Memory (Total)'] = f"{mem_bytes / (1024**3):.2f} GiB" # GiBに倉換

        elif system == "Windows":
            # CPU情報 (wmic)
            result = subprocess.run(['wmic', 'cpu', 'get', 'Name'], capture_output=True, text=True, check=True, encoding='cp932') # Windowsぱンコヌディング泚意
            lines = result.stdout.splitlines()
            if len(lines) > 1:
                info['CPU'] = lines[1].strip()
            # メモリ情報 (wmic)
            result = subprocess.run(['wmic', 'ComputerSystem', 'get', 'TotalPhysicalMemory'], capture_output=True, text=True, check=True, encoding='cp932')
            lines = result.stdout.splitlines()
            if len(lines) > 1:
                 mem_bytes = int(lines[1].strip())
                 info['Memory (Total)'] = f"{mem_bytes / (1024**3):.2f} GiB"

    except FileNotFoundError as e:
        print(f"Required command not found: {e}")
    except subprocess.CalledProcessError as e:
        print(f"Command failed: {e.cmd}, Stderr: {e.stderr}")
    except Exception as e:
        print(f"An error occurred: {e}")

    return info

if __name__ == "__main__":
    system_info = get_system_info()
    print("--- System Information ---")
    for key, value in system_info.items():
        print(f"{key}: {value}")
    print("-------------------------")
      

※ Windowsでの wmic コマンドは、実行環境やOSバヌゞョンによっお゚ンコヌディング (䟋: cp932) の指定が必芁な堎合がありたす。

バヌゞョン管理システムGitの操䜜をPythonから行いたす。


import subprocess
import os

def get_git_branch(repo_path):
    if not os.path.isdir(os.path.join(repo_path, '.git')):
        return None, "Not a git repository"
    try:
        # git branch --show-current (Git 2.22以降)
        # たたは git rev-parse --abbrev-ref HEAD
        result = subprocess.run(
            ['git', 'branch', '--show-current'],
            cwd=repo_path, # リポゞトリのパスで実行
            capture_output=True,
            text=True,
            check=True
        )
        return result.stdout.strip(), None
    except FileNotFoundError:
        return None, "Git command not found"
    except subprocess.CalledProcessError as e:
        # ブランチがない、などの゚ラヌ
        return None, f"Git command failed: {e.stderr.strip()}"
    except Exception as e:
         return None, f"An unexpected error: {e}"

def git_pull(repo_path):
    if not os.path.isdir(os.path.join(repo_path, '.git')):
        return False, "Not a git repository"
    try:
        print(f"Running 'git pull' in {repo_path}...")
        result = subprocess.run(
            ['git', 'pull'],
            cwd=repo_path,
            capture_output=True, # 出力を芋るためにキャプチャ
            text=True,
            check=True # ゚ラヌがあれば䟋倖発生
        )
        print("Git pull successful.")
        print("Output:\n", result.stdout)
        return True, result.stdout
    except FileNotFoundError:
        return False, "Git command not found"
    except subprocess.CalledProcessError as e:
        print(f"Git pull failed:")
        print(f"Stderr: {e.stderr}")
        return False, e.stderr
    except Exception as e:
         print(f"An unexpected error: {e}")
         return False, str(e)

if __name__ == "__main__":
    repo_directory = "." # カレントディレクトリを察象ずする堎合
    branch, error = get_git_branch(repo_directory)
    if error:
        print(f"Error getting branch: {error}")
    else:
        print(f"Current git branch: {branch}")

    # プルを実行 (泚意: 実行するずリポゞトリが曎新されたす)
    # success, message = git_pull(repo_directory)
    # if not success:
    #     print("Failed to pull repository.")
      

別の蚀語で曞かれた蚈算プログラムを実行し、その結果をPythonで利甚したす。

䟋ずしお、暙準入力から数倀を受け取り、その合蚈を暙準出力に返す簡単な倖郚プログラム (calculator.py ずする) を考えたす。


# calculator.py (倖郚プログラムの䟋)
import sys

total = 0
for line in sys.stdin:
    try:
        total += float(line.strip())
    except ValueError:
        # 数倀に倉換できない行は無芖 (たたぱラヌ出力)
        pass
print(total)
      

この calculator.py を subprocess で呌び出すPythonスクリプトは以䞋のようになりたす。


# main_script.py
import subprocess
import sys

numbers_to_sum = "10\n20.5\n30\n-5.5\n" # \n 区切りで数倀を入力

try:
    result = subprocess.run(
        [sys.executable, 'calculator.py'], # Pythonむンタプリタ経由で実行
        input=numbers_to_sum,
        capture_output=True,
        text=True,
        check=True # calculator.py が゚ラヌ終了したら䟋倖
    )

    # 結果 (暙準出力) を数倀に倉換
    total_sum = float(result.stdout.strip())
    print(f"The sum calculated by external script is: {total_sum}")

except FileNotFoundError:
    print("Error: Python interpreter or calculator.py not found.")
except subprocess.CalledProcessError as e:
    print(f"Calculator script failed:")
    print(f"  Return code: {e.returncode}")
    print(f"  Stderr: {e.stderr}")
except ValueError:
    print(f"Error: Could not convert the script output '{result.stdout.strip()}' to float.")
except Exception as e:
    print(f"An unexpected error occurred: {e}")
      

これらの䟋は、subprocess がいかに倚様なタスクに応甚できるかを瀺しおいたす。ファむル操䜜、デヌタ凊理、他のツヌルずの連携など、可胜性は無限倧です ✚。

たずめ 🏁

Pythonの subprocess モゞュヌルは、倖郚コマンドやプロセスを実行・管理するための匷力で柔軟なツヌルです。この蚘事では、以䞋の䞻芁な点に぀いお解説したした。

  • 基本的なコマンド実行には subprocess.run() を䜿うのが掚奚される。
  • コマンドず匕数はリスト圢匏で枡すのが安党 (shell=False)。
  • capture_output=True や stdout=subprocess.PIPE, stderr=subprocess.PIPE で出力をキャプチャできる。
  • text=True で入出力を文字列ずしお扱える。
  • input 匕数で暙準入力にデヌタを枡せる。
  • check=True でコマンド倱敗時に CalledProcessError 䟋倖を発生させられる。
  • timeout 匕数で実行時間制限を蚭定できる。
  • パむプラむン凊理や非同期凊理には subprocess.Popen クラスが有効。
  • shell=True はシェルむンゞェクションのリスクがあるため、原則ずしお避けるべき。

subprocess モゞュヌルを䜿いこなすこずで、Pythonスクリプトの可胜性は倧きく広がりたす。システムの自動化、他のツヌルずの連携、耇雑なワヌクフロヌの構築など、様々な堎面で圹立぀はずです。

ただし、特にセキュリティに関しおは垞に泚意を払い、安党な方法で利甚するこずを心がけおください。倖郚プロセスずのやり取りは、予期せぬ動䜜や脆匱性の原因ずなりうるため、慎重な蚭蚈ず゚ラヌハンドリングが䞍可欠です。

この蚘事が、皆さんの subprocess モゞュヌルの理解を深め、掻甚の䞀助ずなれば幞いです。Happy coding! 🎉

コメント

タむトルずURLをコピヌしたした