Python Requests チートシート

cheatsheet

基本的なリクエスト送信

HTTPリクエストを送信するための基本的な関数群です。

GET リクエスト

指定したURLからリソースを取得します。

import requests

# シンプルなGETリクエスト
response = requests.get('https://httpbin.org/get')

# レスポンスのステータスコード確認
print(f"ステータスコード: {response.status_code} {response.reason}")

# レスポンスの内容 (テキスト) を表示
# print(response.text)

POST リクエスト (フォームデータ)

サーバーにデータを送信します。data引数に辞書を渡すと、フォームエンコードされたデータとして送信されます。

import requests

payload = {'key1': 'value1', 'key2': 'value2'}

# data引数に辞書を渡してPOSTリクエスト
response = requests.post('https://httpbin.org/post', data=payload)

# レスポンスの内容 (JSON) を表示
print(response.json())

POST リクエスト (JSONデータ)

サーバーにJSONデータを送信します。json引数にPythonの辞書やリストを渡すと、自動的にJSON文字列にシリアライズされ、Content-Type: application/json ヘッダーが付与されます。

import requests

payload = {'some': 'data', 'nested': {'value': 123}}

# json引数に辞書を渡してPOSTリクエスト
response = requests.post('https://httpbin.org/post', json=payload)

# レスポンスの内容 (JSON) を表示
print(response.json())

その他のHTTPメソッド

PUT, DELETE, HEAD, OPTIONS など、他のHTTPメソッドも同様の形式で利用できます。

import requests

# PUTリクエスト (データ更新)
response_put = requests.put('https://httpbin.org/put', data={'key': 'value'})
print(f"PUT Status: {response_put.status_code}")

# DELETEリクエスト (リソース削除)
response_delete = requests.delete('https://httpbin.org/delete')
print(f"DELETE Status: {response_delete.status_code}")

# HEADリクエスト (ヘッダーのみ取得)
response_head = requests.head('https://httpbin.org/get')
print(f"HEAD Headers: {response_head.headers}")

# OPTIONSリクエスト (利用可能なメソッド確認)
response_options = requests.options('https://httpbin.org/get')
print(f"OPTIONS Allowed Methods: {response_options.headers.get('Allow')}")

レスポンスの処理

サーバーからのレスポンスを扱うための属性やメソッドです。

属性/メソッド 説明 コード例
response.status_code HTTPステータスコード (整数)。例: 200, 404, 500 print(response.status_code)
response.reason HTTPステータスコードに対応する理由句 (文字列)。例: ‘OK’, ‘Not Found’ print(response.reason)
response.headers レスポンスヘッダー (大文字小文字を区別しない辞書ライクなオブジェクト)。 print(response.headers)
print(response.headers['Content-Type'])
print(response.headers.get('content-type')) # Case-insensitive
response.text レスポンスボディをテキスト (Unicode) として取得。Requestsが推定したエンコーディングでデコードされます。 print(response.text)
response.content レスポンスボディをバイト列として取得。デコードされません。画像やファイルなどのバイナリデータに適しています。 image_data = response.content
with open('image.jpg', 'wb') as f: f.write(image_data)
response.json() レスポンスボディをJSONとしてデコードし、Pythonの辞書またはリストを返す。JSONデコードに失敗した場合は例外が発生します。 data = response.json()
print(data['key'])
response.encoding Requestsがレスポンスから推定したエンコーディング、または手動で設定したエンコーディング。response.text で使用されます。 print(response.encoding) # 推定されたエンコーディング
response.encoding = 'utf-8' # 手動で設定
print(response.text) # 設定したエンコーディングでデコード
response.url リクエストがリダイレクトされた場合、最終的なURL。 print(f"最終的なURL: {response.url}")
response.history リダイレクトが発生した場合、リダイレクト元のレスポンスオブジェクトのリスト (古いものから順)。 if response.history: print("リダイレクトされました:", [r.url for r in response.history])
response.cookies サーバーから送信されたクッキー (RequestsCookieJar オブジェクト)。 cookies = response.cookies
print(cookies['sessionid'])
response.elapsed リクエスト送信からレスポンス受信完了までの経過時間 (timedelta オブジェクト)。 print(f"所要時間: {response.elapsed}")
response.raise_for_status() レスポンスステータスがエラー (4xx or 5xx) の場合に requests.exceptions.HTTPError 例外を発生させる。正常 (2xx) の場合は何もしない。
try:
    response.raise_for_status()
    print("リクエスト成功!")
except requests.exceptions.HTTPError as err:
    print(f"HTTPエラーが発生しました: {err}")
response.request このレスポンスを生成した元のリクエストオブジェクト (PreparedRequest)。ヘッダーやボディを確認できます。 prepared_request = response.request
print(prepared_request.method, prepared_request.url)
print(prepared_request.headers)

リクエストパラメータとヘッダー

リクエストに追加情報を付与する方法です。

URLパラメータ (クエリ文字列) の送信

params引数に辞書を渡すと、URLの末尾に ?key1=value1&key2=value2 のような形式で付加されます。

import requests

# パラメータを辞書で定義
payload = {'key1': 'value1', 'key2': ['value2a', 'value2b']} # 同じキーで複数の値も可

# params引数でGETリクエスト
response = requests.get('https://httpbin.org/get', params=payload)

# 送信されたURLを確認
print(response.url)
# 出力例: https://httpbin.org/get?key1=value1&key2=value2a&key2=value2b

カスタムヘッダーの送信

headers引数に辞書を渡すことで、任意のHTTPヘッダーを送信できます。User-Agentの偽装やAPIキーの送信などによく使われます。

import requests

url = 'https://httpbin.org/headers'
headers = {
    'User-Agent': 'My Awesome Python App/1.0',
    'Accept': 'application/json',
    'X-Api-Key': 'your_secret_api_key_here' # 例: APIキー
}

response = requests.get(url, headers=headers)

# 送信されたヘッダーを確認 (レスポンスの 'headers' フィールドに含まれる)
print(response.json()['headers'])

ファイルのアップロード

files引数を使用して、マルチパートフォームエンコード (multipart/form-data) でファイルをアップロードします。

単一ファイルのアップロード

辞書のキーがフォームのフィールド名、値がファイルオブジェクトになります。

import requests

url = 'https://httpbin.org/post'
# ファイルを開く (バイナリモード 'rb' が推奨)
try:
    with open('my_document.txt', 'rb') as f:
        files = {'file_field_name': f} # 'file_field_name' はサーバー側で期待されるフィールド名
        response = requests.post(url, files=files)
        print(response.json())
except FileNotFoundError:
    print("エラー: my_document.txt が見つかりません。")
except requests.exceptions.RequestException as e:
    print(f"リクエストエラー: {e}")

# ファイルオブジェクトを直接渡す代わりに、タプルで詳細を指定することも可能
# files = {'file': ('report.xls', open('report.xls', 'rb'), 'application/vnd.ms-excel', {'Expires': '0'})}
# ('ファイル名', ファイルオブジェクト, Content-Type, カスタムヘッダー)

ファイルは通常バイナリモード ('rb') で開きます。テキストファイルをテキストモード ('rt') で開いてアップロードすることも可能ですが、エンコーディングの問題が発生する可能性があるため、バイナリモードが安全です。Requestsはファイルの内容に基づいて Content-Type を推測しようとしますが、明示的に指定することも可能です(後述)。

複数ファイルのアップロード

files引数に複数のキーと値のペアを持つ辞書を渡します。

import requests

url = 'https://httpbin.org/post'
try:
    files_to_upload = {
        'text_file': open('document.txt', 'rb'),
        'image_file': open('logo.png', 'rb')
    }
    response = requests.post(url, files=files_to_upload)
    print(response.json()['files']) # アップロードされたファイルの情報
except FileNotFoundError:
    print("エラー: 指定されたファイルが見つかりません。")
except requests.exceptions.RequestException as e:
    print(f"リクエストエラー: {e}")
finally:
    # ファイルハンドルを閉じる (with文を使わない場合)
    if 'files_to_upload' in locals():
        for f in files_to_upload.values():
            if hasattr(f, 'close'):
                f.close()

ファイル名、Content-Type、カスタムヘッダーの指定

files辞書の値として、ファイルオブジェクトの代わりにタプルを使うことで、ファイル名、Content-Type、追加のヘッダーを明示的に指定できます。

import requests

url = 'https://httpbin.org/post'
try:
    with open('data.csv', 'rb') as f:
        files = {
            'csv_data': ('report.csv', f, 'text/csv', {'X-Custom-Header': 'hello'})
            # タプル形式: (ファイル名, ファイルオブジェクト, Content-Type, ヘッダー辞書)
        }
        response = requests.post(url, files=files)
        print(response.json())
except FileNotFoundError:
    print("エラー: data.csv が見つかりません。")
except requests.exceptions.RequestException as e:
    print(f"リクエストエラー: {e}")

# ファイルオブジェクトの代わりにコンテンツを直接指定することも可能
files = {'file': ('dummy.txt', b'This is the file content.', 'text/plain')}
response_direct = requests.post(url, files=files)
print(response_direct.json())

リクエストに認証情報を付加する方法です。

Basic認証

auth引数にユーザー名とパスワードのタプルを渡します。

import requests
from requests.auth import HTTPBasicAuth

url = 'https://httpbin.org/basic-auth/user/pass' # 例: 'user'/'pass' が認証情報

# 方法1: タプルを直接渡す
response1 = requests.get(url, auth=('user', 'pass'))
print(f"方法1 ステータス: {response1.status_code}") # 認証成功なら 200

# 方法2: HTTPBasicAuthオブジェクトを使用
auth = HTTPBasicAuth('user', 'pass')
response2 = requests.get(url, auth=auth)
print(f"方法2 ステータス: {response2.status_code}")

# 認証失敗の例 (間違ったパスワード)
try:
    response_fail = requests.get(url, auth=('user', 'wrongpass'))
    response_fail.raise_for_status() # 401 Unauthorized エラーが発生するはず
except requests.exceptions.HTTPError as e:
    print(f"認証失敗: {e.response.status_code} {e.response.reason}")

Digest認証

requests.auth.HTTPDigestAuth を使用します。

import requests
from requests.auth import HTTPDigestAuth

url = 'https://httpbin.org/digest-auth/auth/user/pass' # 例: Digest認証のエンドポイント
auth = HTTPDigestAuth('user', 'pass')

response = requests.get(url, auth=auth)
print(f"Digest認証 ステータス: {response.status_code}") # 認証成功なら 200

Digest認証はBasic認証より安全ですが、サーバーとクライアントの両方が対応している必要があります。

カスタム認証 (トークンなど)

多くの場合、APIキーやOAuthトークンはカスタムヘッダー (例: Authorization: Bearer YOUR_TOKEN) を使って送信します。これは前述の「カスタムヘッダーの送信」で対応できます。

より複雑な認証メカニズム(例: 署名生成)の場合は、requests.auth.AuthBase を継承してカスタム認証クラスを作成することも可能です。

import requests

# 例: Bearerトークンをヘッダーで送信
token = 'your_super_secret_token'
headers = {'Authorization': f'Bearer {token}'}
response = requests.get('https://api.example.com/protected/resource', headers=headers)
print(response.status_code)

# --- カスタム認証クラスの例 (概念) ---
from requests.auth import AuthBase

class TokenAuth(AuthBase):
    """カスタムトークン認証を付与する"""
    def __init__(self, token):
        self.token = token

    def __call__(self, r):
        # リクエストオブジェクトrを修正する
        r.headers['X-TokenAuth'] = f'{self.token}'
        return r

# 使用例
# response = requests.get('https://httpbin.org/get', auth=TokenAuth('my-secret-token'))
# print(response.request.headers)

セッション管理 (Sessions) 🍪

複数のリクエスト間でクッキーや接続設定を持続させるためにセッションオブジェクトを使用します。

セッションオブジェクトの作成と利用

requests.Session() でセッションオブジェクトを作成し、そのオブジェクトのメソッド (get, post など) を使ってリクエストを送信します。これにより、サーバーからセットされたクッキーはセッションオブジェクト内に保持され、後続のリクエストで自動的に送信されます。

import requests

# セッションオブジェクトを作成
s = requests.Session()

# セッション経由で最初のGETリクエスト (クッキーがセットされることを期待)
s.get('https://httpbin.org/cookies/set/sessioncookie/123456789')

# 2回目のリクエスト (セッションクッキーが自動で送信される)
response = s.get('https://httpbin.org/cookies')

# レスポンスで送信されたクッキーを確認
print("セッションで送信されたクッキー:")
print(response.json()) # {'cookies': {'sessioncookie': '123456789'}} が含まれるはず

# セッションオブジェクトにデフォルトヘッダーを設定することも可能
s.headers.update({'x-test-header': 'true'})
response_with_header = s.get('https://httpbin.org/headers')
print("\nセッションのデフォルトヘッダー:")
print(response_with_header.json()['headers'])

# セッションオブジェクトにデフォルトパラメータを設定
# s.params.update({'param1': 'value1'})

# セッションオブジェクトにデフォルト認証情報を設定
# s.auth = ('user', 'pass')

# セッションを使い終わったら閉じるのが良い場合もある (TCP接続の再利用など)
s.close()

同じホストに対して複数回リクエストを行う場合、セッションオブジェクトを使用すると、TCP接続が再利用されることがあり、パフォーマンスが向上します。また、ログイン状態の維持など、クッキー管理が重要な場合に非常に便利です。

詳細設定

タイムアウト、リダイレクト、SSL検証、プロキシなど、リクエストの挙動を細かく制御します。

タイムアウト設定 ⏱️

timeout引数で、リクエストのタイムアウト秒数を指定します。接続タイムアウトと読み取りタイムアウトを個別に設定することも可能です。

import requests

url = 'https://httpbin.org/delay/5' # 5秒遅延するエンドポイント

try:
    # タイムアウトを3秒に設定 (接続・読み取り共通)
    response = requests.get(url, timeout=3)
except requests.exceptions.Timeout:
    print("リクエストがタイムアウトしました (共通設定)")

try:
    # 接続タイムアウトを1秒、読み取りタイムアウトを4秒に設定
    # 接続タイムアウト: サーバーへの接続確立までの時間
    # 読み取りタイムアウト: 接続後、サーバーからの最初のバイト受信までの時間 (チャンク間の時間ではない)
    response = requests.get(url, timeout=(1, 4))
except requests.exceptions.ConnectTimeout:
    print("接続がタイムアウトしました")
except requests.exceptions.ReadTimeout:
    print("データの読み取りがタイムアウトしました")

try:
    # タイムアウトなし (非推奨: 無限に待機する可能性)
    response_no_timeout = requests.get(url, timeout=None)
    print("タイムアウトなしで完了 (遅延後)")
except requests.exceptions.RequestException as e:
    print(f"タイムアウトなしでもエラー発生の可能性: {e}")

外部へのリクエストには常に適切なタイムアウトを設定することが強く推奨されます。デフォルトではタイムアウトは設定されていません。

リダイレクトの制御

デフォルトではRequestsはリダイレクト (3xxステータスコード) に自動的に追従します。allow_redirects引数でこの挙動を制御できます。

import requests

url = 'https://httpbin.org/redirect/3' # 3回リダイレクトするエンドポイント

# デフォルト (リダイレクト許可)
response_allow = requests.get(url)
print(f"リダイレクト許可時の最終URL: {response_allow.url}")
print(f"リダイレクト履歴: {[r.url for r in response_allow.history]}")
print(f"リダイレクト許可時のステータス: {response_allow.status_code}") # 通常はリダイレクト先の200

# リダイレクト禁止
response_deny = requests.get(url, allow_redirects=False)
print(f"\nリダイレクト禁止時のURL: {response_deny.url}") # 元のURL
print(f"リダイレクト履歴: {response_deny.history}") # 空のリスト
print(f"リダイレクト禁止時のステータス: {response_deny.status_code}") # 302 Found など
print(f"Locationヘッダー: {response_deny.headers.get('Location')}") # リダイレクト先URL

SSL証明書の検証制御 🔒

デフォルトではRequestsはHTTPS接続時にサーバーのSSL証明書を検証します。verify引数でこの挙動を変更できます。

import requests

url_secure = 'https://example.com' # 通常は検証OK
url_self_signed = 'https://self-signed.badssl.com/' # 自己署名証明書 (検証失敗するはず)

# デフォルト (検証有効)
try:
    response_verify_ok = requests.get(url_secure) # 通常成功
    print(f"検証OK: {url_secure} - ステータス: {response_verify_ok.status_code}")

    response_verify_fail = requests.get(url_self_signed) # ここで例外が発生するはず
except requests.exceptions.SSLError as e:
    print(f"SSL検証エラー (期待通り): {e}")

# 検証を無効にする (非推奨: セキュリティリスクあり)
import warnings
from urllib3.exceptions import InsecureRequestWarning

# InsecureRequestWarning を抑制 (自己責任で)
warnings.simplefilter('ignore', InsecureRequestWarning)

try:
    response_no_verify = requests.get(url_self_signed, verify=False)
    print(f"\n検証無効時のステータス ({url_self_signed}): {response_no_verify.status_code} (警告抑制)")
except requests.exceptions.RequestException as e:
    print(f"検証無効でもエラー発生の可能性: {e}")

# 特定のCAバンドルファイルまたはディレクトリを指定
# try:
#     # 例: カスタムCA証明書ファイルへのパス
#     response_custom_ca = requests.get(url_secure, verify='/path/to/custom/ca.pem')
#     print(f"\nカスタムCA使用時のステータス: {response_custom_ca.status_code}")
# except requests.exceptions.RequestException as e:
#     print(f"カスタムCAエラー: {e}")

verify=False は中間者攻撃のリスクを高めるため、絶対にプロダクション環境で使用しないでください。テスト環境や、信頼できる内部ネットワークでのみ限定的に使用すべきです。必要な場合は、代わりに正しいCA証明書を指定 (verify='/path/to/cert') するか、システムの証明書ストアを更新してください。

クライアント証明書を使用する場合は cert 引数を使います。

# cert引数にクライアント証明書ファイルと秘密鍵ファイルのパスをタプルで指定
# response = requests.get('https://example.com', cert=('/path/to/client.crt', '/path/to/client.key'))
# 証明書と鍵が1つのファイルにまとまっている場合は、そのファイルのパスを文字列で指定
# response = requests.get('https://example.com', cert='/path/to/client.pem')

プロキシ設定 🌐

proxies引数にプロキシサーバーのアドレスを辞書で指定します。

import requests

# プロキシサーバーの情報を設定
proxies = {
  'http': 'http://10.10.1.10:3128',    # HTTPリクエスト用のプロキシ
  'https': 'http://user:password@10.10.1.10:1080', # HTTPSリクエスト用のプロキシ (認証情報付き)
  # 'https': 'socks5://user:password@host:port' # SOCKSプロキシ (別途 `requests[socks]` のインストールが必要)
}

# 環境変数 HTTP_PROXY, HTTPS_PROXY が設定されている場合、Requestsは自動的にそれを使用します。
# proxies引数で明示的に指定すると、環境変数の設定は上書きされます。

try:
    # プロキシ経由でリクエスト
    response = requests.get('https://httpbin.org/ip', proxies=proxies)
    print("プロキシ経由で取得したIP情報:")
    print(response.json()) # プロキシサーバーのIPが表示されるはず

    # プロキシを使わない場合は空の辞書を渡すか、引数を省略
    # response_no_proxy = requests.get('https://httpbin.org/ip', proxies={})
except requests.exceptions.ProxyError as e:
    print(f"プロキシエラーが発生しました: {e}")
except requests.exceptions.RequestException as e:
    print(f"リクエストエラー(プロキシ関連含む): {e}")

SOCKSプロキシを使用するには、追加のライブラリが必要です。pip install requests[socks] を実行してください。

エラーハンドリング ⚠️

リクエスト中に発生する可能性のある様々なエラーを適切に処理します。

基本的なHTTPエラーのチェック

response.raise_for_status() メソッドを使うのが最も簡単です。4xx (クライアントエラー) または 5xx (サーバーエラー) のステータスコードの場合に requests.exceptions.HTTPError を発生させます。

import requests

urls_to_check = [
    'https://httpbin.org/status/200', # OK
    'https://httpbin.org/status/404', # Not Found
    'https://httpbin.org/status/500'  # Internal Server Error
]

for url in urls_to_check:
    try:
        response = requests.get(url, timeout=5)
        # ステータスコードが4xxか5xxなら例外発生
        response.raise_for_status()
        print(f"{url}: 成功 (ステータス {response.status_code})")
    except requests.exceptions.HTTPError as http_err:
        print(f"{url}: HTTPエラーが発生しました: {http_err} (ステータス {http_err.response.status_code})")
    except requests.exceptions.ConnectionError as conn_err:
        print(f"{url}: 接続エラーが発生しました: {conn_err}")
    except requests.exceptions.Timeout as timeout_err:
        print(f"{url}: タイムアウトエラーが発生しました: {timeout_err}")
    except requests.exceptions.RequestException as req_err:
        # 上記以外のRequests関連のエラー (リダイレクトが多すぎるなど)
        print(f"{url}: リクエストエラーが発生しました: {req_err}")

具体的な例外クラス

requests.exceptions モジュールには、より具体的なエラー状況に対応する例外クラスが定義されています。これらを個別にキャッチすることで、エラーの種類に応じた処理を行うことができます。

例外クラス 説明
requests.exceptions.RequestException Requestsに関するすべての例外の基底クラス。
requests.exceptions.ConnectionError DNS解決失敗、接続拒否など、ネットワーク接続に関する問題。requests.exceptions.RequestException を継承。
requests.exceptions.ProxyError プロキシサーバーに関する問題。requests.exceptions.ConnectionError を継承。
requests.exceptions.SSLError SSL関連のエラー。requests.exceptions.ConnectionError を継承。
requests.exceptions.Timeout リクエストがタイムアウトした場合。requests.exceptions.RequestException を継承。
requests.exceptions.ConnectTimeout 接続タイムアウト。requests.exceptions.Timeout および requests.exceptions.ConnectionError を継承。
requests.exceptions.ReadTimeout 読み取りタイムアウト。requests.exceptions.Timeout を継承。
requests.exceptions.URLRequired 有効なURLが指定されなかった場合。requests.exceptions.RequestException を継承。
requests.exceptions.TooManyRedirects リダイレクト回数が上限を超えた場合。requests.exceptions.RequestException を継承。
requests.exceptions.MissingSchema URLにスキーマ (http:// や https://) がない場合。requests.exceptions.RequestException, ValueError を継承。
requests.exceptions.InvalidSchema Requestsがサポートしていないスキーマの場合。requests.exceptions.RequestException, ValueError を継承。
requests.exceptions.InvalidURL URLが無効な場合。requests.exceptions.RequestException, ValueError を継承。
requests.exceptions.InvalidHeader ヘッダーが無効な場合。requests.exceptions.RequestException, ValueError を継承。
requests.exceptions.ChunkedEncodingError サーバーが不正なチャンクエンコーディングを送信した場合。requests.exceptions.RequestException を継承。
requests.exceptions.ContentDecodingError レスポンスのデコードに失敗した場合。requests.exceptions.RequestException, BaseDecodeError を継承。
requests.exceptions.StreamConsumedError 既に内容が消費されたストリーミングレスポンスにアクセスしようとした場合。requests.exceptions.RequestException, TypeError を継承。
requests.exceptions.RetryError カスタムリトライロジックが失敗した場合。requests.exceptions.RequestException を継承。
requests.exceptions.HTTPError response.raise_for_status() が失敗した場合 (4xx, 5xx)。requests.exceptions.RequestException を継承。この例外オブジェクトは response 属性を持ち、エラーレスポンスにアクセスできます。

エラーハンドリングを行う際は、より具体的な例外からキャッチし、最後に汎用的な requests.exceptions.RequestException をキャッチするのが一般的です。

高度な使い方 ✨

より特殊なユースケースに対応するための機能です。

ストリーミングダウンロード (大きなファイル)

stream=True を指定すると、レスポンスボディをすぐにダウンロードせず、必要な時に読み込むことができます。これにより、メモリ使用量を抑えながら大きなファイルを扱うことが可能です。

import requests
import shutil # ファイル操作用

url = 'https://speed.hetzner.de/100MB.bin' # 例: 大きなファイル
file_path = 'downloaded_100MB.bin'

try:
    # stream=Trueでリクエスト
    with requests.get(url, stream=True, timeout=60) as r: # タイムアウトも適切に設定
        r.raise_for_status() # エラーチェック

        # レスポンスヘッダーからファイルサイズを取得 (存在すれば)
        total_size = int(r.headers.get('content-length', 0))
        print(f"ダウンロード開始: {file_path} ({total_size} バイト)")

        # ファイルにチャンクごとに書き込む
        chunk_size = 8192 # 8KBずつ読み込む
        downloaded_size = 0
        with open(file_path, 'wb') as f:
            # iter_contentを使ってチャンクを取得
            for chunk in r.iter_content(chunk_size=chunk_size):
                # chunkには最大chunk_sizeバイトのデータが含まれる (Noneの場合もある)
                if chunk:
                    f.write(chunk)
                    downloaded_size += len(chunk)
                    # 進捗表示 (例)
                    progress = (downloaded_size / total_size) * 100 if total_size > 0 else 0
                    print(f"\rダウンロード中: {downloaded_size}/{total_size} バイト ({progress:.2f}%)", end="")

        print("\nダウンロード完了!")

    # shutilを使ってファイルコピーを行うシンプルな例 (メモリに読み込まない)
    # with requests.get(url, stream=True) as r:
    #     r.raise_for_status()
    #     with open(file_path + ".shutil", 'wb') as f:
    #         shutil.copyfileobj(r.raw, f) # response.raw は低レベルなソケットアクセス
    # print("shutilでのコピー完了!")


except requests.exceptions.RequestException as e:
    print(f"\nダウンロード中にエラーが発生しました: {e}")
except Exception as e:
    print(f"\n予期せぬエラー: {e}")

stream=True を使用した場合、レスポンスのコンテンツにアクセスした後、必ず response.close() を呼び出すか、with 文を使用して接続を解放することが重要です。iter_content()iter_lines() を使うと、コンテンツを効率的に処理できます。response.raw は、より低レベルなアクセスを提供しますが、通常は iter_content が推奨されます。

リクエストフック (Hooks)

リクエスト処理の特定のポイントでカスタム関数を呼び出すことができます。主にデバッグやリクエスト/レスポンスのロギング、ヘッダーの動的な変更などに使用されます。

import requests

def print_url(response, *args, **kwargs):
    """レスポンスオブジェクトを受け取り、URLを出力するフック関数"""
    print(f"フック: リクエスト完了 - URL: {response.url}, Status: {response.status_code}")

def add_custom_header(request, *args, **kwargs):
    """準備されたリクエストオブジェクトを受け取り、ヘッダーを追加するフック関数"""
    request.headers['X-Request-Hooked'] = 'True'
    print(f"フック: リクエスト準備完了 - {request.method} {request.url}")
    # 注意: このフックは PreparedRequest オブジェクトを操作する
    return request # フック関数は None または PreparedRequest を返す必要がある

# フックを辞書で定義
hooks = {
    'response': [print_url], # レスポンス受信後に呼び出されるフック (複数の関数をリストで指定可)
    'request': add_custom_header # リクエスト準備完了後、送信前に呼び出されるフック (単一の関数)
}

# hooks引数を指定してリクエスト
response = requests.get('https://httpbin.org/get', hooks=hooks)

print("\nレスポンスヘッダー (サーバー視点):")
# サーバー側で認識されたヘッダーを確認 (X-Request-Hooked があるはず)
# print(response.json()['headers'])

# セッションオブジェクト全体にフックを設定することも可能
# s = requests.Session()
# s.hooks['response'].append(print_url)
# s.get('https://httpbin.org/delay/1')

利用可能なフックポイントは 'response' (レスポンス受信後) と 'request' (リクエスト準備完了後) です。

フック関数は慎重に設計する必要があります。特にレスポンスフックは、ストリーミングレスポンスの場合、コンテンツが消費される前に呼び出されます。フック内でのエラーはリクエスト全体の失敗につながる可能性があります。

コメント

タイトルとURLをコピーしました