一个C语言指针数组和二维数组的小实验

最新推荐文章于 2024-02-19 13:37:47 发布

原创最新推荐文章于 2024-02-19 13:37:47 发布 · 1k 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#c语言 #二维数组 #指针

C 专栏收录该内容

1 篇文章

订阅专栏

本文通过一个小实验深入探讨了C语言中指针数组与二维数组的区别，解释了它们在内存布局上的不同，并通过一个具体例子展示了如何利用指针和类型转换实现对内存特定位置的访问。

一个C语言指针数组和二维数组的小实验

最近在用C语言写toy compiler，写的过程中突然发现自己对指针数组和二维数组的语法有了新的认识。
1. 指针数组
指针数组其实就是一个数组，数组中每个元素都是指针。
2. 二维数组
二维数组也是一个数组，不过数组中的每一个元素都是数组。

乍看起来好像很像对不对，区别只是数组元素不同，但其实这两种东西在内存中的布局完全不一样。再看下面的代码就会发现它们俩更像了：

char *a[5];         // 指针数组
char b[5][5];       // 二维数组

char c = a[3][3];
char d = b[3][3];

这段程序编译是可以通过的，这会给我们一种假象——二维数组和指针数组是一回事。
这当然是不对的，原因其实很简单，a[3][3]和b[3][3]完全不是一回事，虽然长得很像。
其实如果你学过汇编或者计算机组成原理之类的课就会知道，a[3][3]其实可以分成两步：

char *tmp = a[3];
char c = tmp[3];
或者
char c = *(tmp+3);

但是再一想，b[3][3]也可以分成这两步啊，大写懵逼对不对：

char *tmp = b[3];
char d = tmp[3];
或者
char d = *(tmp+3);

区别就在于char *tmp = a[3]这一句，指针数组中a[3]的值就是a向后移动3个sizeof(char *)那个存储单元中的值。而b[3]的值是是b向后移动3*5+3 个sizeof(char)那个位置的地址。

很清楚了，第一个tmp的值是内存里的数据（a是一个指针数组，所以tmp的值就是指针），第二个tmp的值是地址（这个地址其实是编译器在代码生成时就静态生成了的）。

以一个例子结尾，这个例子只能在i386平台或者其他32位小端模式的CPU上运行。

#include <stdio.h>

void m(char *ar[]) {
    char a = ar[0][3];
    printf("%c", a);
}

int main() {
    char a[5][5];
    char b = 'a';
    char *pb = &b;
    pb = pb-3;
    a[0][0] = (char)((int)pb);
    a[0][1] = (char)((int)pb>>8);
    a[0][2] = (char)((int)pb>>16);
    a[0][3] = (char)((int)pb>>24);
    m((char **)a);

}

其中a是一个二维数组，而m()中的ar是一个元素是char *的数组。我的目的就是想让把a传入m()中，在m()中使用ar访问。
对ar[0][3]的访问就像刚刚说的，访问的是ar[0]指向的那个数组中第三个元素。

这里写图片描述

现在我们让a的前四个元素a[0][0-3]分别赋值为&b-3的地址各八位。然后将a赋值给ar。所以ar[0][3]访问的就是由a[0][0-3]所构成的地址指向的数组的第三个成员b。这里ar[0]其实并没有指向一个数组指针，只是我们把ar[0]变成了&b-3罢了。