庆云php

庆云php

最详细的php使用com读取word文件,并且解决读取过程中乱码问题,doc/docx都适用,适用于thinkphp

PHP 0

   一,确认php版本,最好是高于5.6

二,将以下两行代码放入php.ini中并且重启

 
  1. //这个是开启扩展
  2. extension=php_com_dotnet.dll
  3. //这个是COM扩展里自带的,只需将前面的;去掉就可以了
  4. com.allow_dcom = true

简单的六步读取法

Version}";

//3、把它的可见性设置为0(假),如果要使它在最前端打开,使用1(真)

$word->Visible = 0;

//4、打开一个文档

$word->Documents->open(dirname(__FILE__)."/aa1.doc");

//5、读取文档内容

$test= $word->ActiveDocument->content->Text;

//6、输出文档内容

echo $test;

下边为更详细的方法

三,自己编写一个三方类库文件,phpcom.php,如下:

  1. class PHPcom {
  2. /**
  3. * 返回word内容,和字数(字符数),版本
  4. * @param $url
  5. * @return array
  6. */
  7. public static function php_com($url)
  8. {
  9. $word = new COM("word.application") or die("Unable to instantiate Word");
  10. //打开路径为URL的word,doc或docx都可以
  11. $word->Documents->OPen($url);
  12. //读取内容
  13. $test= $word->ActiveDocument->content->Text;
  14. //统计字数
  15. $num = strlen($test);
  16. //解决读取过程中乱码问题
  17. $content= iconv('GB2312', 'UTF-8', $test);
  18. //查看版本
  19. $word_wersion = $word->Version;
  20. //是否要打开文件,0代表否,1代表是
  21. $word->Visible = 0;
  22. //关闭word句柄
  23. $word->Quit();
  24. //释放对象
  25. $word = null;
  26. return [
  27. 'num'=>$num/2,
  28. 'word_wersion'=>$word_wersion,
  29. 'content'=>$content
  30. ];
  31. }
  32. }
  33. ?>

四,在thinkphp的根目录下找到vendor文件夹,没有就自己创建一个

五,在vendor文件夹下创建phpcom文件夹,然后把phpcom.php文件放进去

ps:至此,准备工作就做好了,接下来我们就可以在常用函数文件(common.php)里写一个自定义函数了

六,在公共函数类common.php中写一个方便调用的方法

  1. function read_com_word($url=''){
  2. //加载类库文件
  3. vendor("phpcom.phpcom");
  4. //剪切url目录(这是我自己的目录问题)
  5. $url = strstr($url,"uploads");
  6. $url = 'http://localhost/'.$url;
  7. //然后静态调用php_com方法就可以了
  8. $result = PHPcom::php_com($url);
  9. return $result;
  10. }

七:注意,url有一个地方需要修改,就是你们传进来的url千万不能是绝对地址,不能是D:\WWW\这种,,一定要自己框架的路由地址,比如localhost/..,不然会出现错误,因为用绝对地址读取word内容,只能读取一次,然后word就会被锁定,然后就无法读取了,下面附上本人血的经验

八,现在php使用com读取word的流程就走完了,够详细吧?如果上面有什么不到位的地方,还请各路大神指点一下。