[C言語のはじめ方] Part15: 文字列とポインタ

C言語

Step 3: ポインタの理解 – 文字列とポインタ ✨

ポインタを使って文字列をもっと自由に扱おう!

こんにちは!C言語学習、順調に進んでいますか?😊 これまでポインタの基本的な概念、アドレス演算子(&)、間接参照演算子(*)、配列とポインタの関係、そしてポインタを使った関数呼び出し(参照渡し)について学んできましたね。

今回は、C言語プログラミングで非常によく使われる「文字列」と「ポインタ」の深い関係について掘り下げていきます。ポインタを理解することで、文字列の操作が格段に効率的かつ柔軟になります。少し難しいかもしれませんが、ここを乗り越えれば C言語マスターに一歩近づけますよ!💪

💡 このステップのゴール

  • 文字列リテラルとポインタの関係を理解する。
  • 文字配列とポインタを使って文字列を操作する方法を学ぶ。
  • ポインタが文字列操作関数でどのように役立つかを知る。
  • ポインタの配列を使って複数の文字列を扱う方法を理解する。

1. 文字列リテラルとポインタ

C言語では、ダブルクォーテーション(")で囲まれたテキストを「文字列リテラル」と呼びます。例えば、"Hello, World!" は文字列リテラルです。

文字列リテラルは、プログラムが実行されるときにメモリ上の特別な領域(多くの場合、読み取り専用)に配置されます。そして、この文字列リテラルの先頭文字のアドレスを、char 型のポインタ変数に格納することができます。

#include <stdio.h>

int main(void) {
    // char型のポインタ変数 ptr に文字列リテラル "Hello" の
    // 先頭文字 'H' のアドレスを格納する
    char *ptr = "Hello";

    printf("文字列: %s\n", ptr); // ポインタを使って文字列全体を出力
    printf("先頭文字: %c\n", *ptr); // ポインタを使って先頭文字 'H' を出力
    printf("2番目の文字: %c\n", *(ptr + 1)); // ポインタ演算で 'e' を出力
    printf("3番目の文字: %c\n", ptr[2]); // 配列のようにアクセスして 'l' を出力 (ポインタは配列のように扱える)

    return 0;
}

このコードを実行すると、ptr は文字列 “Hello” の最初の文字 ‘H’ が格納されているメモリアドレスを指します。printf 関数で %s 書式指定子を使うと、ポインタが指すアドレスから始まって、ヌル文字(\0)が現れるまでの文字を連続して出力してくれます。

また、*ptr でポインタが指す先の値(’H’)を取得したり、*(ptr + 1)ptr[1] (配列と同じ記法が使える!)で次の文字 ‘e’ にアクセスしたりできます。

⚠️ 注意点: 文字列リテラルの変更は禁止!

文字列リテラルは通常、読み取り専用のメモリ領域に格納されます。そのため、文字列リテラルを指すポインタを使って、その内容を変更しようとすると、未定義動作(プログラムがクラッシュするなど、何が起こるかわからない状態)を引き起こす可能性があります。絶対にやめましょう!

// これは危険なコードです!コンパイルは通るかもしれませんが、実行時に問題が起こる可能性が高いです。
char *ptr = "Hello";
// ptr[0] = 'J'; // やってはいけない! "Hello" の 'H' を書き換えようとしている
// *ptr = 'J';   // これも同様に危険!

文字列の内容を変更したい場合は、次に説明する「文字配列」を使う必要があります。

2. 文字配列とポインタ

文字列を扱うもう一つの方法は、char 型の配列を使うことです。これは Step 2 で学びましたね。

#include <stdio.h>

int main(void) {
    // 文字配列として文字列を定義 (末尾にヌル文字 '\0' が自動で追加される)
    char str_array[] = "World";

    // 配列名は、配列の先頭要素のアドレスを示すポインタのように扱える
    char *p = str_array; // ポインタ p に配列 str_array の先頭アドレスを格納

    printf("配列を使った文字列: %s\n", str_array);
    printf("ポインタを使った文字列: %s\n", p);

    // 配列の内容を変更する (これは安全!)
    str_array[0] = 'C'; // 'W' を 'C' に変更
    p[1] = 'o';       // 'o' を 'o' に変更 (結果的に変わらないが、操作は可能)
    *(p + 2) = 'a';   // 'r' を 'a' に変更

    printf("変更後の文字列: %s\n", str_array); // "Coald" と出力される

    return 0;
}

文字配列で定義された文字列は、読み書き可能なメモリ領域(通常はスタック領域や静的領域)に確保されます。そのため、配列の要素を後から変更することが可能です。これが文字列リテラルとの大きな違いです。✅

そして重要な点は、配列名はその配列の先頭要素のアドレスを示すということです。つまり、str_array&str_array[0] と同じ意味を持ちます。そのため、char *p = str_array; のように、char 型のポインタ変数に配列名を代入できます。

ポインタを使えば、配列の要素にアクセスする方法がさらに広がります。

#include <stdio.h>

int main(void) {
    char message[] = "Programming C";
    char *ptr = message; // ptr は message[0] ('P') のアドレスを指す

    printf("最初の文字: %c\n", *ptr); // P

    // ポインタをインクリメントして次の文字へ
    ptr++;
    printf("次の文字: %c\n", *ptr); // r

    printf("--- ループで文字列を表示 ---\n");
    // ポインタを使って文字列を最後まで走査する
    ptr = message; // ポインタを先頭に戻す
    while (*ptr != '\0') { // ヌル文字に到達するまでループ
        printf("%c", *ptr);
        ptr++; // ポインタを次の文字のアドレスへ進める
    }
    printf("\n");

    return 0;
}

この例のように、ポインタ変数 ptr をインクリメント(ptr++)することで、配列の次の要素を指すように移動できます。これを利用して、while ループと組み合わせることで、文字列の先頭から終端(ヌル文字 \0)までを効率的に処理できます。これは C言語の文字列操作で非常によく使われるテクニックです。🚀

3. ポインタを使った文字列操作関数

C言語の標準ライブラリには、文字列を操作するための便利な関数がたくさん用意されています(例えば、<string.h> ヘッダファイルに含まれる strcpy, strcat, strlen など)。これらの関数の多くは、内部でポインタを駆使して実装されています。

例として、文字列の長さを計算する関数 strlen のようなものを、ポインタを使って自作してみましょう。

#include <stdio.h>

// 文字列 s の長さを計算する関数 (ヌル文字を含まない)
// const char *s は、この関数内で s が指す文字列を変更しないことを示す
size_t my_strlen(const char *s) {
    size_t length = 0;
    while (*s != '\0') { // ポインタ s が指す文字がヌル文字でない間
        length++;      // 長さをインクリメント
        s++;           // ポインタを次の文字へ進める
    }
    return length;
}

int main(void) {
    char str1[] = "Hello";
    const char *str2 = "World!"; // 文字列リテラルなので const をつけるのがより安全

    printf("'%s' の長さ: %zu\n", str1, my_strlen(str1)); // 5
    printf("'%s' の長さ: %zu\n", str2, my_strlen(str2)); // 6

    return 0;
}

この my_strlen 関数では、引数として const char *s を受け取っています。

  • char *s: schar 型データへのポインタであることを示します。つまり、文字列の先頭文字のアドレスを受け取ります。
  • const: const キーワードは、「このポインタ s が指す先の内容を変更しません」という宣言です。これにより、関数内で誤って文字列を書き換えてしまうことを防ぎ、関数の意図を明確にすることができます。文字列を受け取るだけの関数の場合は、const をつけるのが良い習慣です。👍
  • size_t: 文字列の長さやメモりのサイズなど、負の値を取らないサイズを表すための型です。通常は unsigned intunsigned long などで定義されています。<stdio.h><string.h> などで定義されています。

関数内では、ポインタ s を使って文字列をヌル文字(\0)までたどり、その間の文字数をカウントしています。このように、ポインタを使うことで、文字列データを効率的に関数に渡し、処理することができます。

4. ポインタ配列と文字列

複数の文字列をまとめて扱いたい場合、ポインタの配列(char * 型の配列)が便利です。これは、各要素が文字列(の先頭アドレス)を指すポインタとなる配列です。

#include <stdio.h>

int main(void) {
    // 文字列リテラルを指すポインタの配列
    const char *messages[] = {
        "Initialization complete.",
        "File not found.",
        "Access denied.",
        "Operation successful."
        // 配列のサイズは初期化子から自動的に決まる
    };

    int num_messages = sizeof(messages) / sizeof(messages[0]); // 配列の要素数を計算

    printf("--- Stored Messages ---\n");
    for (int i = 0; i < num_messages; i++) {
        printf("[%d]: %s\n", i, messages[i]);
    }

    // messages[1] は "File not found." という文字列リテラルの先頭アドレスを指している
    printf("\nMessage 1: %s\n", messages[1]);
    // messages[1][0] は 'F' を指す
    printf("First character of message 1: %c\n", messages[1][0]);
    // *(messages[1] + 5) は 'n' を指す
    printf("6th character of message 1: %c\n", *(messages[1] + 5));

    // 注意: messages[i] が指す文字列リテラルの内容は変更できない!
    // messages[1][0] = 'f'; // これは未定義動作を引き起こす可能性あり!

    return 0;
}

この例では、messages という配列を定義しています。この配列の各要素(messages[0], messages[1], ...)は、それぞれ異なる文字列リテラル("Initialization complete.", "File not found.", ...)の先頭アドレスを格納する const char * 型のポインタです。

この方法の利点は、各文字列の長さが異なっていても、配列で簡単に管理できる点です。二次元配列(char messages[][100] のような形)を使う方法もありますが、その場合は全ての文字列のために最大の長さ分のメモリを確保する必要があり、メモリが無駄になる可能性があります。ポインタ配列なら、必要な分だけ(ポインタのサイズ + 文字列リテラル自体のサイズ)メモリを使います。

ただし、この例のように文字列リテラルを直接指している場合は、その文字列の内容を変更できない点に注意が必要です。もし変更が必要な文字列の集まりを扱いたい場合は、各文字列を文字配列として確保し、その配列のアドレスをポインタ配列に格納する、といった工夫が必要になります(これは少し応用的な内容になります)。

まとめ

今回は、C言語における文字列とポインタの重要な関係について学びました。

🎉 今回のポイント

  • 文字列リテラル("...")は、通常読み取り専用メモリに格納され、その先頭アドレスを char * ポインタで指すことができる。ただし、ポインタ経由での変更は危険!⚠️
  • 文字配列(char str[] = "...")は、書き込み可能なメモリに格納され、内容を変更できる。配列名はその先頭アドレスを示すため、char * ポインタに代入できる。✅
  • ポインタ演算(ptr++)を使うことで、文字列の文字を効率的にたどることができる。これは文字列処理の基本テクニック。🚀
  • 標準ライブラリの文字列関数はポインタを活用している。自作関数でも、引数に const char * を使うことで、文字列を効率的に、かつ安全に扱うことができる。🛡️
  • ポインタの配列(char *arr[])を使うことで、複数の文字列(特に長さが異なるもの)を柔軟に管理できる。

ポインタと文字列の関係を理解することは、C言語プログラミングにおいて非常に重要です。最初は少し混乱するかもしれませんが、コードを書き、動かしながら、ポインタがメモリ上のどこを指しているのかを意識することで、徐々に理解が深まっていくはずです。🤔

次回は、さらにポインタの理解を深める「二重ポインタ」について学んでいきます。これもまたC言語の強力な機能の一つですので、お楽しみに!

コメント

タイトルとURLをコピーしました