mamweb/various/utils.py


								bez_diakritiky = ({}

									# FIXME: funguje jen pro český a slovenský text, jinak jsou špatně

									# transliterace. Potenciální řešení:

									# https://stackoverflow.com/questions/517923/what-is-the-best-way-to-remove-accents-normalize-in-a-python-unicode-string

									# (ale přidává to další závislosti…)


									# Tisknutelné ASCII

									| {chr(a): chr(a) for a in range(32, 126+1)}


									# České, slovenské a blízké diakritiky a divnoznaky

									| { x: 'a' for x in 'áÁäÄ'}

									| { x: 'c' for x in 'čČ'}

									| { x: 'd' for x in 'ďĎ'}

									| { x: 'e' for x in 'éÉěĚëË'}

									| { x: 'i' for x in 'íÍ'}

									| { x: 'l' for x in 'ľĽĺĹ'}

									| { x: 'n' for x in 'ňŇ'}

									| { x: 'o' for x in 'óÓöÖôÔ'}

									| { x: 'r' for x in 'řŘŕŔ'}

									| { x: 's' for x in 'šŠßẞ'}

									| { x: 't' for x in 'ťŤ'}

									| { x: 'u' for x in 'úÚůŮ'}

									| { x: 'y' for x in 'ýÝ'}

									| { x: 'z' for x in 'žŽ'}

									)


								# Tabulka pro str.translate

								class _bez_diakritiky_translate:

									def __getitem__(self, it):

										return ord(bez_diakritiky.get(chr(it), None))

								bez_diakritiky_translate = _bez_diakritiky_translate()


								# TODO: testy?


								# Pozor: zarovnáno velmi netradičně pro přehlednost

								roman_numerals = zip((1000, 900, 500, 400,  100, 90,   50,  40,   10,  9,    5,   4,    1),

													 ('M', 'CM', 'D', 'CD', 'C', 'XC', 'L', 'XL', 'X', 'IX', 'V', 'IV', 'I'))


								def roman(num):

									res = ""

									for i, n in roman_numerals:

										res += n * (num // i)

										num %= i

									return res


								def from_roman(rom):

									if not rom:

										return 0

									for i, n in roman_numerals:

										if rom.upper().startswith(n):

											return i + from_roman(rom[len(n):])

									raise Exception('Invalid roman numeral: "%s"', rom)