lua 的值类型

lua 的值类型

lua 是动态类型的语言,即是说类型附着于值而不是变量。在 lua 脚本里,变量是没有类型的,只有值才具有类型。这跟 C\C++ 相比不太一样, C\C++ 里的类型是附着于变量的。

lua 里有八种类型: boolean, number, string, table, userdata, function, thread, nil

思考一下:lua 脚本里的值在解释器里是怎样表示的?如何做到类型附着于值?

1. 从 lua_pushnumber, lua_pushstring 入手

C\C++ 通过 lua_pushnumber 等函数将 int, char* 等类型的值压入 lua 栈,从而传递给 lua。我们就从这儿来入手,看看 int, char* 等 C\C++ 的值是如何在 lua 栈里表示的。

从 lua_pushnumber 的定义代码里可以看到,它从 lua_State 里取出 top,并把 bool 值传给了一个宏 setbvalue(obj, x)
而在 setbvalue 里,obj 被转换成了 TValue 类型,接着又调用了两个宏 val_(), settt_() 来设置 TValue 类型的两个成员。

再看看别的 lua_push 函数及 setvalue 宏,也都是从 lua_State 里取出 top,并将其转换为 TValue 类型:

由此可见,lua 栈中所有类型的值都是用 TValue 结构体来表示的。

2. 查看 TValue 结构体

先看注释,TValue 是 Tagged Values 的缩写。正如探索的结论,TValue 是 lua 值的基本表示。它由一个实际的 value 和一个值类型的 tag 组成。

TValue 结构体有两个成员 value_, tt_。

tt_ 成员的类型可以从 LUA_TNUMINT 等定义处找到:

value_ 是一个 union 类型 Value。所以它可以存储多种类型的值。

typedef union Value {
  GCObject *gc;    /* 可以被垃圾回收的对象, */
  void *p;         /* light userdata */
  int b;           /* 布尔值 */
  lua_CFunction f; /* light C functions */
  lua_Integer i;   /* 整形值 */
  lua_Number n;    /* 浮点数值 */
} Value;

lua_Number 是在以下两个文件里定义出来的,可以看到它实际上是个 double 类型。在需要时,可以方便地修改 lua_Number 的类型:

3. 查看 GCObject 结构体

Value 联合体中有一个 GCObject 成员,这个结构体用于表示可以被垃圾回收的对象,像是 string, table 这些。现在来看看 GCObject 结构体张啥样:

很奇怪,它的成员只有用宏 CommonHeader 定义的 GCObject *next; lu_byte tt; lu_byte marked 这几个。这几个成员显然表示不了 string,table 这些类型。
看注释可以知道,CommonHeader 是给所有可回收对象用的,可以被包含在其它对象中。所以我们就搜索一下有哪些对象包含了这个 CommonHeader:

可以看到,可以被垃圾回收的对象(string, userdata, function, thread, table) 的结构体声明里,第一行都是 CommonHeader。

先不讨论各个类型的结构体意义,在 CommonHeader 宏里,next 字段说明可回收对象是可以放到链表里的,而 marked 字段是 GC 用来进行标记的。这些内容以后再探讨,值得注意的是表示类型的 tt 字段。TValue 里不是已经有一个 tt_ 字段用于表示类型了吗?为什么在 GCObject 里还需要这个字段呢?

这个问题可以这样想:

  1. 要从 GCObject 反向得到 TValue 是不行的,假如 GCObject 没有 tt 字段,单单持有 GCObject 的时候,没法判断这个 GCObject 的类型是什么。
  2. GC 在回收对象的时候需要根据类型来释放资源。基于第一点,必须在 GCObject 里加一个表示类型的字段 tt。

最后附上一张 lua 值内存表示的图:
x


总结

  1. lua 中的值在 C 中都用 TValue 结构体来表示;TValue 有两个成员 Value value_; int tt_ Value 是一个联合体,可以存储所有类型的值。访问 TValue 的时候,先通过 tt_ 获取 TValue 的类型,然后将 Value 转换为对应的类型进行访问。比如:
TValue value = xxx;
if(value.tt_ == LUA_TBOOLEAN)
{
  int bFlag = value.value_.b;
}
  1. 对于可垃圾回收的对象,也可以用同样的方式来转换的到原对象。因为所有的可垃圾回收对象的开头都是 CommonHeader

引用

The Inplementation of Lua5.0
Lua源码分析(2) -- 对象表示

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 33,890评论 18 399
  • 1. 写在前面 很多时候我们都需要借助一些脚本语言来为我们实现一些动态的配置,那么就会涉及到如何让脚本语言跟原生语...
    杰嗒嗒的阿杰阅读 3,491评论 9 31
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 7,218评论 0 17
  • 我谈过几个不错的对象,每一个的都在一年以上,断断续续的纠缠着不放过。 我很念旧。小时候买东西也好...
    疯狂的你i阅读 176评论 0 0
  • 这是第二次读这本书,第一次为阿月,阿瑶,小白龙这些可怜的女子伤感,为孙悟空的失去而痛苦,感觉很难受。第二次读却不一...

友情链接更多精彩内容