Java中想要获取汉字首字母,可以使用pinyin4j这个工具类来实现,首先需要引入pinyin4j这个工具包,代码如下:
<dependency> <groupId>com.belerweb</groupId> <artifactId>pinyin4j</artifactId> <version>2.5.0</version> </dependency>
引入这个pinyin4j工具包之后,就可以来用ChineseCharacterUtil这个类来封装一个获取汉字拼音或者首字母的方法了,代码如下:
package com.tpyyes;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
/***
* 汉字工具类
* @author Johwang
* @since 2018.10.26
*
*/
public class ChineseCharacterUtil {
private final static String NUM = "0123456789";
/***
* 将汉字转成拼音(取首字母或全拼)
* @param hanzi
* @param full 是否全拼
* @return
*/
public static String convertHanzi2Pinyin(String hanzi,boolean full)
{
/***
* ^[\u2E80-\u9FFF]+$ 匹配所有东亚区的语言
* ^[\u4E00-\u9FFF]+$ 匹配简体和繁体
* ^[\u4E00-\u9FA5]+$ 匹配简体
*/
String regExp="^[\u4E00-\u9FFF]+$";
StringBuffer sb=new StringBuffer();
if(hanzi==null||"".equals(hanzi.trim()))
{
return "";
}
String pinyin="";
for(int i=0;i<hanzi.length();i++)
{
char unit=hanzi.charAt(i);
if(match(String.valueOf(unit),regExp))//是汉字,则转拼音
{
pinyin=convertSingleHanzi2Pinyin(unit);
if(full)
{
sb.append(pinyin);
}
else
{
sb.append(pinyin.charAt(0));
}
}
else
{
sb.append(unit);
}
}
return sb.toString();
}
/***
* 将单个汉字转成拼音
* @param hanzi
* @return
*/
private static String convertSingleHanzi2Pinyin(char hanzi)
{
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
String[] res;
StringBuffer sb=new StringBuffer();
try {
res = PinyinHelper.toHanyuPinyinStringArray(hanzi,outputFormat);
sb.append(res[0]);//对于多音字,只用第一个拼音
} catch (Exception e) {
e.printStackTrace();
return "";
}
return sb.toString();
}
/***
* @param str 源字符串
* @param regex 正则表达式
* @return 是否匹配
*/
public static boolean match(String str,String regex)
{
Pattern pattern=Pattern.compile(regex);
Matcher matcher=pattern.matcher(str);
return matcher.find();
}
/**
* 获取汉字首拼音,包含数字字符
* @param hanzi 源字符串
* @param full
* @return
*/
public static String getFirstPinyin(String hanzi,boolean full) {
String s = convertHanzi2Pinyin(hanzi, full).substring(0, 1).toUpperCase();
if(NUM.contains(s)) {
s = numBerToPinyin(s);
}
return s;
}
/**
* 将数字[0-9]转化为拼音首字母大写
* @param str
* @return
*/
public static String numBerToPinyin(String str) {
String pinyin = null;
switch (str) {
case "0":
pinyin = "Z";
break;
case "1":
pinyin = "Y";
break;
case "2":
pinyin = "E";
break;
case "3":
pinyin = "S";
break;
case "4":
pinyin = "S";
break;
case "5":
pinyin = "W";
break;
case "6":
pinyin = "L";
break;
case "7":
pinyin = "Q";
break;
case "8":
pinyin = "B";
break;
case "9":
pinyin = "J";
break;
}
return pinyin;
}
}那么如何使用java方法获取汉字首字母呢?代码如下:
用法一:如果有多个汉字
String s = ChineseCharacterUtil.convertHanzi2Pinyin("我是中国人",false);
System.out.println(s);如果第二个参数为false,则输出结果为:wszgr
如果第二个参数为true,则输出结果为:woshizhongguoren
用法二:如果只是想获取一个汉字的首写拼音,则可以如下:
String s = ChineseCharacterUtil.getFirstPinyin("我是中国人",true);
System.out.println(s);输出结果为:W