mamweb/various/utils.py

bez_diakritiky = ({}
	# FIXME: funguje jen pro český a slovenský text, jinak jsou špatně
	# transliterace. Potenciální řešení:
	# https://stackoverflow.com/questions/517923/what-is-the-best-way-to-remove-accents-normalize-in-a-python-unicode-string
	# (ale přidává to další závislosti…)

	# Tisknutelné ASCII
	| {chr(a): chr(a) for a in range(32, 126+1)}

	# České, slovenské a blízké diakritiky a divnoznaky
	| { x: 'a' for x in 'áÁäÄ'}
	| { x: 'c' for x in 'čČ'}
	| { x: 'd' for x in 'ďĎ'}
	| { x: 'e' for x in 'éÉěĚëË'}
	| { x: 'i' for x in 'íÍ'}
	| { x: 'l' for x in 'ľĽĺĹ'}
	| { x: 'n' for x in 'ňŇ'}
	| { x: 'o' for x in 'óÓöÖôÔ'}
	| { x: 'r' for x in 'řŘŕŔ'}
	| { x: 's' for x in 'šŠßẞ'}
	| { x: 't' for x in 'ťŤ'}
	| { x: 'u' for x in 'úÚůŮ'}
	| { x: 'y' for x in 'ýÝ'}
	| { x: 'z' for x in 'žŽ'}
	)

# Tabulka pro str.translate
class _bez_diakritiky_translate:
	def __getitem__(self, it):
		return ord(bez_diakritiky.get(chr(it), None))
bez_diakritiky_translate = _bez_diakritiky_translate()

# TODO: testy?