74 Star 201 Fork 56

mz / php-pinyin

Gitee — Enterprise-level DevOps R&D management platform
Join Gitee
This repository doesn't specify license. Without author's permission, this code is only for learning and cannot be used for other purposes.
Clone or download
pinyin.class.php 111.05 KB
Copy Edit Web IDE Raw Blame History
mz authored 2016-10-09 01:01 . fix make tool bug
<?php
/*
* @desc 汉字转拼音单元
* @author Djunny <mozhua@gmail.com>
*/
class pinyin {
static $data = NULL;
public static function init_data() {
static $init_data = 0;
if ($init_data == 0) {
$init_data = 1;

}
}
/**
*
* main method for pinyin
*
* @param string $str
* @param int $first_char
* @param string $split_char
* @param string $except_char
*
* @return string
*/
public static function get($str, $first_char = 0, $split_char = '', $except_char = '') {
self::init_data();
// 返回结果
$result = '';
// 中文字符标记
$is_ch = 0;
// 按中文长度遍历字符串
for ($i = 0, $j = mb_strlen($str, 'utf-8'); $i < $j; $i++) {
$res = '';
// 是否添加分隔符
$add_split = 0;
// 取出当前字符
$char = mb_substr($str, $i, 1, 'utf-8');
// 判断是否多字节字符(是否是中文或者中文符号)
if (strlen($char) > 1) {
// 将字符串转为 GBK 编码(双字节)
$gbk = mb_convert_encoding($char, 'GBK', 'utf-8');
// 取出字符串,将第一个字符的ASCII * 256 + 第二个字符的 ASCII - 65535 得到表中的 code 索引下标
$code = ord($gbk[0]) * 256 + ord($gbk[1]) - 65536;
// 找到表中 code 下标对应的字符
$res = self::find($code, self::$data);
// 判断如果没有找到对应的 code 下标,则在生辟字字典中查找
if (!$res && array_key_exists($char, self::$data['word']) && $res = self::$data['word'][$char]) {
$res = self::$data['pinyin'][$res];
}
// 标记中文
$is_ch = 1;
// 中文字符需要加分隔符
$add_split = 1;
} else {
// 为数字或者英文字符
$res = $char;
// 如果之前有中文标记,则在前边添加分隔符
if ($is_ch) {
$add_split = 1;
}
$is_ch = 0;
}
// 如果找到拼音或者是数字或英文字符,或者当字符串 === '0'
if ($res || $res === '0') {
// 如果当前字符不是第一个,而且需要添加分隔符
if ($i > 0 && $split_char && $add_split) {
// 添加分隔符至结果
$result .= $split_char;
}
// 添加当前结果
$result .= $first_char ? $res[0] : $res;
}
}
// 分隔符和保留字符加正则转义
$preg_char = preg_quote($split_char);
$except_char = preg_quote($except_char);
// 替换掉所有不相关的字符或英文标点
$result = preg_replace("/([^\w{$except_char}" . $preg_char . "]" . ($preg_char ? $preg_char . '?' : '') . ")*/i", '', $result);
// 返回结果
return $result;
}
/**
* find word in table
*
* @param $num
* @param $data
*
* @return string
*/
static function find($num, &$data) {
if ($num < -20319 || $num > -10247) {
return '';
}
$num += 20319;
foreach ($data['code'] as $k => $v) {
if ($k > $num) {
return $data['pinyin'][$v - 1];
}
}
}
}
?>

Comment ( 0 )

Sign in for post a comment

PHP
1
https://git.oschina.net/mz/php-pinyin.git
git@git.oschina.net:mz/php-pinyin.git
mz
php-pinyin
php-pinyin
master

Search