Java中想要获取汉字首字母,可以使用pinyin4j这个工具类来实现,首先需要引入pinyin4j这个工具包,代码如下:
<dependency> <groupId>com.belerweb</groupId> <artifactId>pinyin4j</artifactId> <version>2.5.0</version> </dependency>
引入这个pinyin4j工具包之后,就可以来用ChineseCharacterUtil这个类来封装一个获取汉字拼音或者首字母的方法了,代码如下:
package com.tpyyes; import java.util.regex.Matcher; import java.util.regex.Pattern; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; /*** * 汉字工具类 * @author Johwang * @since 2018.10.26 * */ public class ChineseCharacterUtil { private final static String NUM = "0123456789"; /*** * 将汉字转成拼音(取首字母或全拼) * @param hanzi * @param full 是否全拼 * @return */ public static String convertHanzi2Pinyin(String hanzi,boolean full) { /*** * ^[\u2E80-\u9FFF]+$ 匹配所有东亚区的语言 * ^[\u4E00-\u9FFF]+$ 匹配简体和繁体 * ^[\u4E00-\u9FA5]+$ 匹配简体 */ String regExp="^[\u4E00-\u9FFF]+$"; StringBuffer sb=new StringBuffer(); if(hanzi==null||"".equals(hanzi.trim())) { return ""; } String pinyin=""; for(int i=0;i<hanzi.length();i++) { char unit=hanzi.charAt(i); if(match(String.valueOf(unit),regExp))//是汉字,则转拼音 { pinyin=convertSingleHanzi2Pinyin(unit); if(full) { sb.append(pinyin); } else { sb.append(pinyin.charAt(0)); } } else { sb.append(unit); } } return sb.toString(); } /*** * 将单个汉字转成拼音 * @param hanzi * @return */ private static String convertSingleHanzi2Pinyin(char hanzi) { HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); String[] res; StringBuffer sb=new StringBuffer(); try { res = PinyinHelper.toHanyuPinyinStringArray(hanzi,outputFormat); sb.append(res[0]);//对于多音字,只用第一个拼音 } catch (Exception e) { e.printStackTrace(); return ""; } return sb.toString(); } /*** * @param str 源字符串 * @param regex 正则表达式 * @return 是否匹配 */ public static boolean match(String str,String regex) { Pattern pattern=Pattern.compile(regex); Matcher matcher=pattern.matcher(str); return matcher.find(); } /** * 获取汉字首拼音,包含数字字符 * @param hanzi 源字符串 * @param full * @return */ public static String getFirstPinyin(String hanzi,boolean full) { String s = convertHanzi2Pinyin(hanzi, full).substring(0, 1).toUpperCase(); if(NUM.contains(s)) { s = numBerToPinyin(s); } return s; } /** * 将数字[0-9]转化为拼音首字母大写 * @param str * @return */ public static String numBerToPinyin(String str) { String pinyin = null; switch (str) { case "0": pinyin = "Z"; break; case "1": pinyin = "Y"; break; case "2": pinyin = "E"; break; case "3": pinyin = "S"; break; case "4": pinyin = "S"; break; case "5": pinyin = "W"; break; case "6": pinyin = "L"; break; case "7": pinyin = "Q"; break; case "8": pinyin = "B"; break; case "9": pinyin = "J"; break; } return pinyin; } }
那么如何使用java方法获取汉字首字母呢?代码如下:
用法一:如果有多个汉字
String s = ChineseCharacterUtil.convertHanzi2Pinyin("我是中国人",false); System.out.println(s);
如果第二个参数为false,则输出结果为:wszgr
如果第二个参数为true,则输出结果为:woshizhongguoren
用法二:如果只是想获取一个汉字的首写拼音,则可以如下:
String s = ChineseCharacterUtil.getFirstPinyin("我是中国人",true); System.out.println(s);
输出结果为:W