51dev.com IT技术开发者社区

51dev.com 技术开发者社区

php的serialize序列化和json性能测试

PHPIT技术学习阅读(269)2018-04-21 收藏0次评论

最近需要对大数组做存储,需要在serialize序列化和json之间做了选择。因此需要做了性能测试。

在php5.2之前对数组存储的时候,大都使用serialize系列化。php5.2之后,开始内置了 JSON 的支持。

在网上看到有些资料说:json_encode和json_decode比内置的serialize和unserialize函数要高效。耳闻不如眼见,眼见不一定为实。那就用实际数据测试吧.....

我们先理解概念:

 

一、 序列化

序列化是将对象状态转换为可保持或可传输的格式的过程。与序列化相对的是反序列化,它将流转换为对象。这两个过程结合起来,可以轻松地存储和传输数据。

将对象的状态信息转换为可以存储或传输的窗体的过程。 在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。

通常,对象实例的所有字段都会被序列化,这意味着数据会被表示为实例的序列化数据。这样,能够解释该格式的代码有可能能够确定这些数据的值,而不依赖于该 成员的可访问性。类似地,反序列化从序列化的表示形式中提取数据,并直接设置对象状态,这也与可访问性规则无关。 对于任何可能包含重要的安全性数据的对象,如果可能,应该使该对象不可序列化。如果它必须为可序列化的,请尝试生成特定字段来保存不可序列化的重要数据。 如果无法实现这一点,则应注意该数据会被公开给任何拥有序列化权限的代码,并确保不让任何恶意代码获得该权限。

 

 

二、 JSON

JSON,JavaScript Object Notation,一种更轻、更友好的用于接口(AJAX、REST等)数据交换的格式。 JSON是结构化数据串行化的文本格式,作为XML的一种替代品,用于表示客户端与服务器间数据交换有效负载的格式。它是从ECMAScript语言标准 衍生而来的。JSON的设计目标是使它成为小的、轻便的、文本的,而且是JavaScript的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成。

JSON建构有两种结构:
1. “名称/值”对的集合(A collection of name/value pairs)。不同的语言中,它被理解为对象(object),记录(record),结构(struct),字典(dictionary),哈希表 (hash table),有键列表(keyed list),或者关联数组 (associative array)。


2.值的有序列表(An ordered list of values)。在大部分语言中,它被理解为数组(array)。

测试:

 

三、 实际测试

在PHP 5.3下执行:我们先使用小的数据做测试:

<?php    
$target = array (    
   'battle_id'=> 257    
   ,'user_id'=> 41248    
   ,'user_id2'=> 23989    
   ,'player'=> 41248    
   ,'formation'=> Array    
        (    
           '41248'=> 1    
           ,'23989'=> 2    
        )    
    
   ,'result'=> 1    
   ,'battle_type'=> 1    
   ,'speed'=> Array    
        (    
           '41248'=> 0    
           ,'23989'=> 0    
        )    
        );    
    
$json = json_encode($target);    
$seri = serialize($target);    
    
echo "json :" , strlen($json) ,'<br/>';    
echo "serialize :", strlen($seri) ,'<br/>';    
    
$stime = microtime(true);    
for ($i = 0; $i < 10000; $i ++) {    
    json_encode($target);    
}    
$etime = microtime(true);    
    
echo "json_encode :", ($etime - $stime) ,'<br/>';    
    
//----------------------------------    
    
$stime = microtime(true);    
for ($i = 0; $i < 10000; $i ++) {    
   json_decode($json,true);    
}    
$etime = microtime(true);    
    
echo "json_decode :", ($etime - $stime),'<br/>';    
    
//----------------------------------    
$stime = microtime(true);    
for ($i = 0; $i < 10000; $i ++) {    
    serialize($target);    
}    
$etime = microtime(true);    
    
echo "serialize :", ($etime - $stime) ,'<br/>';    
    
//----------------------------------    
$stime = microtime(true);    
for ($i = 0; $i < 10000; $i ++) {    
    unserialize($seri);    
}    
$etime = microtime(true);    
    
echo "unserialize :", ($etime - $stime),'<br/>';    
    
?>    

测试结果:

json :156
serialize :222
json_encode :0.1087498664856
json_decode :0.12652111053467
serialize :0.041656017303467
unserialize :0.040987968444824
 

测试结果看出json效率稍微比serialize差点,在php5.2可能会更差。应该是在php5.3之后,json扩展做了优化。

然后使用大数组做测试(代码放到最后,因为代码的数组比较长):

测试结果:

json :5350
serialize :8590
json_encode :0.90479207038879
json_decode :1.753741979599
serialize :1.3566699028015
unserialize :1.3003630638123

我们可以看出,serialize比json差了快一个数量级。

总结:

1) 空间的比较

serialize在编码后大概是json的1.5倍。

 

原因:

  • serialize后字符串包含了子串的长度,这可能是速度方面的优化,但是测试结果不尽人意
  • serialize有更加详细的类型区分,而json只有四种类型,并且是以简单的符号表示。
  • 2)速度的比较
  • 在较小数据的情况下, serialize比json快数量级。
    大数据量的情况下,json比serialize稍微差一点 3)处理对象
    json无法处理对象方法等数据。 4)使用范围
    • 序列化使用serialize,特别是对象的存储。这是其存在的意义。
    • 与对象无关的数据存储可以使用json,如包含大量数字的数组等。
    •  
      • 在前后端交互一般都使用JSON,另外,目前JSON只支持UTF-8编码的数据。
    补充:测试代码有误,在测试json_decode效率时,错写成了json_encode,所以测试结果中json_decode的执行时间实际上上在用json_encode编码一段编码成JSON数据格式的字符串的执行时间。

实际上的json_decode的执行时间要比unserialize 长的多

以上就是php的serialize序列化和json性能测试的全部内容,请多关注【51DEV】IT技术开发者社区。

相关内容