Nebo je také dobré, pokud tedy máte Word, použít softwaru přímo od Microsoftu: jmenuje se to MS Office HTML Filter 2.0. http://office.microsoft.com/downloads/2000/Msohtmf2.aspx
Vtipné je, že to je pouze pro Word 2000 a kamarádka to v Office XP prostě nenainstalovala... (Což mě u MS nijak nepřekvapuje.)
Jinak zmiňované konvertítko pro Python je sice pěkné, ale nějak si nerozumělo s kódováním češtiny windows-1250, které mám tady v HTML souborech z Wordu...
Dalsi vychtavkou jsou seznamy(vycty). Zatimco
necislovany zacina a konci tam kde se nachazi.
Tak cislovany existuje pouze jeden v celem dokumentu a ten se tahne
pres cely dokument a jeho itemy jsou ruzne
hluboko zanorene v jinych tagach. Zacatek takoveho
cislovaneho seznamu se pozna podle toho, ze tag itemu obsahuje atribut, ktery urcuje poradove cislo itemu =1.
Prevest neco takoveho do XML je opravdu lahudka.
Tahle zrudnost pravdepodobne odpovida tomu jak je cislovany vycet ve W97 interne reprezontovan.
Zkuste dat vyctu ve wordu nejaky styl a prevest ho
z cislovaneho na necislovany a nazpatek.