正火抛光L

在UTF8中,\ u0141是一个资本L,可以通过它稍作冲刺
在此图像中看到:http://static.peterbe.com/lukasz.png
我尝试了:
''
我希望它能将其转换为" L",因为那就是它
视觉上看起来像.而且我以前看过它成为正常的ascii l
在其他程序中,例如Thunderbird.
我还尝试了其他形式:'nfc','nfkc','nfd'和'nfkd'
他们都没有帮助.
我究竟做错了什么?

# 回答1


*彼得·本格森(Peter Bengtsson)(2007年10月15日星期一16:33:26 -0000)
''
我希望它能将其转换为" L",因为那就是它
视觉上看起来像.而且我以前看过它成为正常的ascii l
在其他程序中,例如Thunderbird.
" l"实际上像英语" w" ...
'0043 0327'
'C'
''
# 回答2


Thorsten Kampe写道:
'?'最初来自" l"()和
是Afaik转录的.
另外,我的一个朋友写了自己的"卢卡斯"(发音为l-)
尽管以波兰语为单位,他的名字是乌克萨斯(Short Wh-).
问候,
比约恩
- -
BOFH借口#126:
它内部有英特尔
# 回答3


Peter Bengtsson ''
我希望它能将其转换为" L",因为那就是它
视觉上看起来像.而且我以前看过它成为正常的ascii l
在其他程序中,例如Thunderbird.
我还尝试了其他形式:'nfc','nfkc','nfd'和'nfkd'
他们都没有帮助.
我究竟做错了什么?
我遇到了同样的问题,我的小研究表明了这个问题
是由Unicode标准本身引起的.我不知道为什么
但是带有中风的角色没有规范的等效.
我查看了这个文件:http://unicode.org/public/unidata/unicodedata.txt
并比较了两个职位:
1.

0142;拉丁小字母l带卒中; ll; 0; l ;;;;;;;; n;拉丁小字母l slash \
;; 0141 ;; 0141
0141;拉丁大写字母l带中风; lu; 0; l ;;;;;;; n;拉丁大写字母l slash \
;;; 0142;

2.

0105;拉丁小字母a with ogonek; ll; 0; l; 0061 0328 ;;;;; n;拉丁小字母a ogonek \
;; 0104 ;; 0104

在第二个位置,在第6个场中有规范等效的
但是在1-ST中什么都没有.我不知道什么理由
是背后的,但可能有些东西. )
问候,
罗布
# 回答4


* Bjoern Schliessmann(2007年10月15日星期一21:51:54 +0200)
'?'最初来自" l"()和
是Afaik转录的.
有很多可能的抄录,"拉丁大写字母l
用中风."转录是语言依赖的,所以英语和
德国对波兰名称的抄录不同.
为什么您尝试使用不属于的字符集中的字符
包含这些字符?那没有任何意义.
Thorsten
# 回答5


10月16日,上午2:33,Peter Bengtsson ''
我希望它能将其转换为" L",因为那就是它
视觉上看起来像. 而且我以前看过它成为正常的ascii l
在其他程序中,例如Thunderbird.
我还尝试了其他形式:'nfc','nfkc','nfd'和'nfkd'
他们都没有帮助.
我究竟做错了什么?
所讨论的角色不是组成的(以Unicode的方式
手段)的" l"和一点斜线;因此
"归一化"和"分解"不适用.
要"验证"此类文本,您需要构建一个适合的查找表
您的目的. unicodedata.decomposition()(偶然地)在
提供此类表的 *条目.
# 回答6


Thorsten Kampe写道:
我认为Knode足够聪明,可以切换到UTF-8.显然,它
不是.
问候,
比约恩
- -
BOFH借口#121:
Halon系统脱离并杀死了操作员.
# 回答7


Thorsten Kampe写道:
'?'最初来自" l"()和
是Afaik转录的.
另外,我的一个朋友写了自己的"卢卡斯"(发音为l-)
尽管以波兰语为名,他的名字是ÅUKAS(Short Wh-).
问候,
bjã¶rn
- -
BOFH借口#126:
它内部有英特尔
# 回答8


在10月15日,晚上10:57,约翰·马奇(John Machin) 所讨论的角色不是组成的(以Unicode的方式
手段)的" l"和一点斜线;因此
"归一化"和"分解"不适用.
要"验证"此类文本,您需要构建一个适合的查找表
您的目的. unicodedata.decomposition()(偶然地)在
提供此类表的 *条目.
谢谢!这解释了这一点.
# 回答9


在10月22日,晚上7:50,Mike Orr 不,但这是唯一有意义的转换.唯一的西班牙语
没有惯例的标准共同转换的信件
IS是"ñ",通常被认为是n,nn,gn,nh,ni,ny,〜n,n〜,
或N,所有这些都经常在互联网上看到.
实际上,有一个硬编码的转换,正在放弃所有
完全重音字母,这是恕我了解的
惯例.我有瓦尔帕拉索和维纳del的图片画廊
Mar的URL是.../Valparasoviadelmar.如果我写了一个博客条目
关于pingüinos和ñandúes,它可能看起来像.../ping-inos-
and-es.丑陋和主题:)
- -
Roberto Bonvallet

标签: python

添加新评论