错误处理
  到现在为止,一直隐含假定输入文档是格式规范的文档。但是不能保证情况都是如此。像任何 XML 解析器一样,只要发现一个规范格式错误,XMLReader 就必须停止处理。如果是这样的话,read() 函数将返回 false。
  从理论上讲,解析器将报告数据直到发现第一个错误。但是在对小型文档进行试验时,几乎是立刻显示错误信息。底层解析器将预解析大块文档,对它进行缓存,然后每次分发出一小块文档。因此往往会过早地检查错误。出于安全考虑,不要假定在发现第一个规范格式错误之前能够解析内容。此外,也不要假设解析错误出现之前看不到任何内容。如果希望只接受完整的、格式规范的文档,那么请确保在看到文档终点之前脚本不能进行任何不可逆操作。
  如果解析器检测到规范格式错误,那么 read() 函数将显示如下错误消息(如果启用了详细错误报告,且位于开发服务器上时):
  Warning: XMLReader::read() [function.read]: 
  < value>10 in /var/www/root.php 
  on line 35
  您可能不希望将它复制到用户所看到的 HTML 页面中。更好的方法是在 $php_errormsg 环境变量中捕获错误消息。为此,需要启用 php.ini 文件中的 track_errors 配置选项:
   
track_errors = On
  默认情况下,track_errors 选项是关闭的;这在 php.ini 中是显式指定的,因此请确保更改了该行代码。如果提早在 php.ini 中添加了上述一行代码(正如最初我所进行的操作),则后面的 track_errors = Off 代码将重写先前的代码。
  该程序仅将响应发送到完整的、格式良好的输入。(也是有效的,不过将实现这点。)因此您需要等待,直到完成了文档的解析(已经跳出 while 循环)。这时,检查是否设置了 $php_errormsg 变量。如果没有进行设置,则文档是格式良好的文档,然后发送 XML-RPC 响应消息。如果设置了该变量,则文档不是格式良好的文档,并发送 XML-RPC 错误响应。如果有人请求负数的平方根,也将发送错误响应。清单 8 展示以上操作。
  清单 8. 检查文档格式是否良好
  // set up the request 
  $request = $HTTP_RAW_POST_DATA; 
  error_reporting(E_ERROR | E_WARNING | E_PARSE); 
  if (isset($php_errormsg)) unset(($php_errormsg); 
  // create the reader 
  $reader = new XMLReader(); 
  // $reader->setRelaxNGSchema("request.rng"); 
  $reader->XML($request); 
  $input = ""; 
  while ($reader->read()) { 
  if ($reader->name == "double" && $reader->nodeType == XMLReader::ELEMENT) { 
  while ($reader->read()) { 
  if ($reader->nodeType == XMLReader::TEXT 
  || $reader->nodeType == XMLReader::CDATA 
  || $reader->nodeType == XMLReader::WHITESPACE 
  || $reader->nodeType == XMLReader::SIGNIFICANT_WHITESPACE) { 
  $input .= $reader->value; 
  } 
  else if ($reader->nodeType == XMLReader::END_ELEMENT 
  && $reader->name == "double") { 
  break; 
  } 
  } 
  break; 
  } 
  } 
  // make sure the input was well-formed 
  if (isset($php_errormsg) ) fault(21, $php_errormsg); 
  else if ($input < 0) fault(20, "Cannot take square root of negative number"); 
  else respond($input);
  这是 XML 流处理中简单的常见模式。解析器将填写一个数据结构,当完成文档时该数据结构将起作用。通常数据结构要比文档本身简单。这里所使用的数据结构尤其简单:一个字符串。
  验证
  到目前为止,对于验证数据是否位于所预期的地方,并没有给予关注。实现该验证的最简单的方法是检查文档的模式。XMLReader 支持 RELAX NG 模式语言;清单 9 展示了简单的 RELAX NG 模式,用于这个特定的 XML-RPC 请求表单。
  libxml 版本 
  在 libxml 的早期版本中,RELAX NG 有一些严重错误,XMLReader 取决于 libxml 库。请确保所使用的版本至少是 2.06.26 版。很多系统(包括 Mac OS X Tiger)捆绑了较早的、有错误的 libxml 版本。
  清单 9. XML-RPC 请求
datatypeLibrary="http://www.w3.org/2001/XMLSchema-datatypes">
sqrt
  可以使用 setRelaxNGSchemaSource() 将模式作为一串文字直接嵌入 PHP 脚本,或者使用 setRelaxNGSchema() 从外部文件或 URL 读取模式。例如,假定清单 9 位于 sqrt.rng 文件中,下面将展示如何载入模式:
   
reader->setRelaxNGSchema("sqrt.rng")
  在开始解析文档 之前,执行上述操作。解析器在进行读取时将检查文档的模式。若要检查文档是否有效,则调用 isValid(),如果文档是有效的(目前为止),则返回 true,否则,返回 false。清单 10 展示了完整的程序,包括所有错误处理。这样将接受任何合法输入,然后返回正确的值,而且将拒绝所有不正确的请求。我还添加了 fault() 方法,当发生故障时将发送 XML-RPC 错误响应。
  清单 10. 完整的 XML-RPC 平方根服务器
   
header('Content-type: application/xml'); 
  // try grammar 
  $schema = " 
  xmlns='http://relaxng.org/ns/structure/1.0' 
  datatypeLibrary='http://www.w3.org/2001/XMLSchema-datatypes'> 
  sqrt 
  "; 
  if (!isset($HTTP_RAW_POST_DATA)) { 
  fault(22, "Please make sure always_populate_raw_post_data = On in php.ini"); 
  } 
  else { 
  // set up the request 
  $request = $HTTP_RAW_POST_DATA; 
  error_reporting(E_ERROR | E_WARNING | E_PARSE); 
  // create the reader 
  $reader = new XMLReader(); 
  $reader->setRelaxNGSchema("request.rng"); 
  $reader->XML($request); 
  $input = ""; 
  while ($reader->read()) { 
  if ($reader->name == "double" && $reader->nodeType == XMLReader::ELEMENT) { 
  while ($reader->read()) { 
  if ($reader->nodeType == XMLReader::TEXT 
  || $reader->nodeType == XMLReader::CDATA 
  || $reader->nodeType == XMLReader::WHITESPACE 
  || $reader->nodeType == XMLReader::SIGNIFICANT_WHITESPACE) { 
  $input .= $reader->value; 
  } 
  else if ($reader->nodeType == XMLReader::END_ELEMENT 
  && $reader->name == "double") { 
  break; 
  } 
  } 
  break; 
  } 
  } 
  if (isset($php_errormsg) ) fault(21, $php_errormsg); 
  else if (! $reader->isValid()) fault(19, "Invalid request"); 
  else if ($input < 0) fault(20, "Cannot take square root of negative number"); 
  else respond($input); 
  $reader->close(); 
  } 
  function respond($input) 
  { 
  ?> 
  echo sqrt($input); 
  ?> 
  } 
  function fault($code, $message) 
  { 
  echo " 
  faultCode 
  " . $code . " 
  faultString 
  " . $message . " 
  "; 
  }   
  属性
  在正常的推解析期间不会看到属性。若要读取属性,请停止在元素的起点处,通过名称或编号来请求特定属性。
  将需要的属性名称传递到 getAttribute(),以便在当前元素上查找该属性的值。例如,下面的语句请求当前元素的 id 属性:
   
$id = $reader->getAttribute("id");
  如果属性位于名称空间中 —— 例如,xlink:href —— 则调用 getAttributeNS(),将本地名称和名称空间 URI 分别作为第一个和第二个参数进行传递。(前缀是无关紧要的。)例如,下面的语句将请求 http://www.w3.org/1999/xlink/ 名称空间中 xlink:href 属性的值:
$href = $reader->getAttributeNS("href", http://www.w3.org/1999/xlink/);
  如果属性不存在,那么这两种方法都将返回空字符串。(这是不正确的。它们应该返回 null。当前设计很难区分值为空字符串的属性和值根本不存在的属性。)
  属性次序
  在 XML 文档中,属性次序并不重要,并且不受解析器的保护。这里用于属性索引的编号仅仅是为了方便起见。不能保证开始标记中的第一个属性就是属性 1,第二个就是属性 2 等等。不要编写依赖于属性次序的代码。
  如果仅希望了解元素上的所有属性,并且事先并不知道属性名,那么当读取器位于元素上时,调用 moveToNextAttribute()。一旦解析器位于属性节点上,就可以读取属性的名称、名称空间以及元素所使用的相同属性的值。例如,以下代码片段将打印当前元素的所有属性: 
if ($reader->hasAttributes and $reader->nodeType == XMLReader::ELEMENT) { 
  while ($reader->moveToNextAttribute()) { 
  echo $reader->name . "='" . $reader->value . "'\n"; 
  } 
  echo "\n"; 
  }
  对于 XML API 来说非常难得的是,XMLReader 允许从元素的起点 或终点 读取属性。为了避免重复计算,确认代码类型是 XMLReader::ELEMENT 而不是 XMLReader::END_ELEMENT 是很重要的,后者也可能拥有属性。
  结束语
 
  XMLReader 是添加到 PHP 程序员工具箱中的一个很有用的工具。与 SimpleXML 不同,它是处理所有文档(而不是部分文档)的完整 XML 解析器。与 DOM 不同,它可以处理大于可用内存的文档。与 SAX 不同,它将程序置于控制之下。如果 PHP 程序需要接受 XML 输入,则 XMLReader 是很值得考虑的一个工具。