深入理解PHP之OpCode - tiandirensoon - ITeye博客

`

tiandirensoon

浏览: 597377 次

最近访客更多访客>>

haijun8

fangjinlin

ecs2003

whh华

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (1113)

社区版块

存档分类

最新评论

youjianbo_han_87： lua 脚本如何写啊。不懂lua啊
使用MySQL Proxy解决MySQL主从同步延迟
hzxlb910：没法看
Ext.data库
yscyfy：别copy好吗？网上找的都妹的一样！
google ProtoBuf开发者指南
cherrycmd：谢谢。
PHP之源码目录结构
hongloumengyanzxw： it's good
Linux环境编程--waitpid与fork与execlp

深入理解PHP之OpCode

阅读更多

OpCode是一种PHP脚本编译后的中间语言，就像Java的ByteCode,或者.NET的MSL。此文主要基于《 Understanding OPcode》和网络，根据个人的理解和修改，特记录下来：
PHP代码：

PHP执行这段代码会经过如下4个步骤：
1. Scanning (Lexing) ,将PHP代码转换为语言片段(Tokens)
2. Parsing , 将Tokens转换成简单而有意义的表达式
3. Compilation , 将表达式编译成Opocdes
4. Execution , 顺次执行Opcodes，每次一条，从而实现PHP脚本的功能。

注：现在有的Cache比如：APC ，可以使得PHP缓存Opcodes ，这样，每次有请求来临的时候，就不需要重复执行前面3步，从而能大幅的提高PHP的执行速度。

首先，Zend/zend_language_scanner.c 会根据Zend/zend_language_scanner.l(Lex文件)，来对输入的 PHP代码进行词法分析，从而得到一个一个的“词”，PHP4.2+开始提供了一个函数叫token_get_all ，这个函数就可以将一段PHP代码 Scanning成Tokens；

将会得到如下结果：
Array
(
[0] => Array
(
[0] => 367
[1] => <?php

[2] => 1
)
[1] => Array
(
[0] => 370
[1] =>
[2] => 2
)
[2] => Array
(
[0] => 316
[1] => echo
[2] => 2
)
[3] => Array
(
[0] => 370
[1] =>
[2] => 2
)
[4] => Array
(
[0] => 315
[1] => "Hello World"
[2] => 2
)
[5] => ;
[6] => Array
(
[0] => 370
[1] =>

[2] => 2
)
[7] => Array
(
[0] => 309
[1] => $a
[2] => 3
)
[8] => Array
(
[0] => 370
[1] =>
[2] => 3
)
[9] => =
[10] => Array
(
[0] => 370
[1] =>
[2] => 3
)
[11] => Array
(
[0] => 305
[1] => 1
[2] => 3
)
[12] => Array
(
[0] => 370
[1] =>
[2] => 3
)
[13] => +
[14] => Array
(
[0] => 370
[1] =>
[2] => 3
)
[15] => Array
(
[0] => 305
[1] => 1
[2] => 3
)
[16] => ;
[17] => Array
(
[0] => 370
[1] =>

[2] => 3
)
[18] => Array
(
[0] => 316
[1] => echo
[2] => 4
)
[19] => Array
(
[0] => 370
[1] =>
[2] => 4
)
[20] => Array
(
[0] => 309
[1] => $a
[2] => 4
)
[21] => ;
[22] => Array
(
[0] => 370
[1] =>

[2] => 4
)
[23] => Array
(
[0] => 369
[1] => ?>
[2] => 5
)
)
返回的结果，源码中的字符串，字符，空格，都会原样返回。每个源代码中的字符，都会出现在相应的顺序处。而，其他的比如标签，操作符，语句，都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码，比如,T_ECHO,T_STRING)，和源码中的原来的内容。
接下来，就是Parsing阶段了，Parsing首先会丢弃Tokens Array中的多于的空格，然后将剩余的Tokens转换成一个一个的简单的表达式
1. echo a constant string
2. add two numbers together
3. store the result of the prior expression to a variable
4. echo a variable
然后，就改Compilation阶段了，它会把Tokens编译成一个个op_array，每个op_arrayd包含如下5个部分：
1. Opcode数字的标识，指明了每个op_array的操作类型，比如add，echo
2. 结果存放Opcode结果
3. 操作数1给Opcode的操作数
4. 操作数2
5. 扩展值1个整形用来区别被重载的操作符

比如，PHP代码会被Parsing成:
[root@localhost html]# /usr/local/php/bin/php -dvld.active=1 hello.php
Branch analysis from position: 0
Return found
filename: /var/www/html/hello.php
function name: (null)
number of ops: 6
compiled vars: !0 = $a
line # op fetch ext return operands
-------------------------------------------------------------------------------
2 0 ECHO 'Hello+world'
3 1 ADD ~0 1, 1
2 ASSIGN !0, ~0
4 3 ECHO !0
6 4 RETURN 1
5* ZEND_HANDLE_EXCEPTION
Hello world2

每个操作数都是由以下两个部分组成：
a) op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CV
b) u,一个联合体，根据op_type的不同，分别用不同的类型保存了这个操作数的值(const)或者左值(var)

而对于var来说，每个var也不一样。 IS_TMP_VAR, 顾名思义，这个是一个临时变量 ，保存一些op_array的结果，以便接下来的op_array使用，这种的操作数的u保存着一个指向变量表的一个句柄（整数），这种操作数一般用~开头，比如~0,表示变量表的0号未知的临时变量IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制，这种变量保存着被它引用的变量的地址 ，当一个变量第一次被引用的时候，就会被CV起来，以后对这个变量的引用就不需要再次去查找active符号表了，CV变量以 ! 开头表示。
$a 变量就被优化成 !0 了。

原文出处：http://blog.csdn.net/laruence/article/details/2673488

==========

如何得到PHP的opcode?

需要安装vld，装完之后使用方法如下：

php -d vld.active=1 -d vld.execute=0 -f yourscript.php

这里有不少opcode的样例。

ps还有个不错的调试函数是debug_zval_dump();

分享到：

深入理解PHP原理之变量(Variables inside ... | PHP源代码分析－字符串搜索系列函数实现详 ...

2011-11-15 14:37
浏览 624
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

深入理解PHP之OpCode原理详解: 主要介绍了深入理解PHP之OpCode原理,较为详细的分析了php程序的相关编译机制与运行原理,需要的朋友可以参考下

PHP 5.3 OPCODE工具(用于zend 加密php 5.3分析,逆向): php opcode的反解,用于分析PHP ,逆向PHP 加密,由OPCODE转换PHP代码. WINDOWS 版本的使用: 开始,运行,CMD 进入PHP所在目录,执行: Php.exe –c php.ini 111.php 回车,即可查看:111.php 的OPCODE值. 用这个工具,可以...

深化理解PHP之OpCode原理详解_.docx: 深化理解PHP之OpCode原理详解_.docx

汇编指令之OpCode快速入门: 汇编指令之OpCode快速入门，关于操作码得东西，比较少见。

OpcodeMap: OpcodeMap

opcode编译器机器码: 编写汇编编译器机器码opcode编译器机器码

常用 Opcode命令大集合: 本资源是Opcode命令的集合，你可以方便的查阅到各种Opcode命令，希望对你会有帮助。

PHP中opcode缓存简单用法分析: 本文实例讲述了PHP中opcode缓存简单用法。分享给大家供大家参考，具体如下： 1.什么是opcode 解释器分析代码之后，生成可以直接运行的中间代码，就称做操作码，opcode 2.解释器与编译器的区别解释器是生成了中间...

Opcode.zip: Opcode机器码的对应解析位图，有助于更好的去解析Opcode机器码。

x86 opcode structure and instruction overview.pdf: x86 opcode structure and instruction overview

PHP7如何开启Opcode打造强悍性能详解: 前言鸟哥在博客中说，提高PHP 7性能的几个tips，第一条就是... Optimizer+ 将PHP代码预编译生成的脚本文件 Opcode 缓存在共享内存中供以后反复使用，从而避免了从磁盘读取代码再次编译的时间消耗。同时，它还应用了

ARM&Thumb; opcode: arm和thumb指令的详细opcode，便于指令查询和熟悉指令。

Opcode定义和查询: 包含机器指令规范操作码查询表指令时钟周期查询表

Opcode轻量级的碰撞检测库: Ogre轻量级碰撞检测。一些简单的漫游，并不需要大的物理引擎支持，简单的碰撞检测，用Opcode完全可以轻松实现。

PHP内核学习教程之php opcode内核实现: opcode是计算机指令中的一部分，用于指定要执行的操作，指令的格式和规范由处理器的指令规范指定。除了指令本身以外通常还有指令所需要的操作数，可能有的指令不需要显式的操作数。这些操作数可能是寄存器中的值...

Svin的OpCode教程: Svin的OpCode教程，自己看那看。 Svin的OpCode教程

利用PHP扩展vld查看PHP opcode操作步骤: 首先下载最新版vld扩展：复制代码代码如下: ~/public_html/php-5.3.13/ext> wget http://pecl.php.net/get/vld-0.11.2.tgz ~/public_html/php-5.3.13/ext> tar zxvf vld-0.11.2.tgz ~/public_...

Global site tag (gtag.js) - Google Analytics