By jarnoan on
Rupesin ihmettelemään, kun Drupalissamme 6.19-päivityksen jälkeen monet käännökset katkeavat ääkkösten kohdalta. Esimerkiksi "Arvojen m" kun pitäisi luultavasti olla "Arvojen määrä".
Etsiskelin mistä vika johtuu, ja näyttäisi olevan katkoja jo käännöstiedostossa http://ftp.drupal.org/files/translations/6.x/cck/cck-6.x-2.8.fi.po:
msgid "Above"
msgstr "Yll"
msgid "Number of values"
msgstr "Arvojen m"
Voi olla muuallakin kuin cck:ssa, mutta tuo tuli ekana vastaan. Tuollakaan ei suinkaan kaikissa käännöksissä katkea ääkkösen kohdalla, mutta monessa kuitenkin.
t. Jarno
Groups audience:

Comments
Myös Drupal 7
Drupal 7:ssa on myös sama ongelma.
(esim. http://ftp.drupal.org/files/translations/7.x/drupal/drupal-7.0.fi.po)
Ja ainakin joissakin muissa 6.x paketeissa.
Enkoodausongelma
Kuulostaa aivan merkistöjen enkoodausongelmalta ja tosiaan näyttää siltä että Drupal.org ei aseta näitä .po-tiedostojen merkistöjä oikein. Millä laiteympäristöllä (käyttis + selain) olette yrittäneet ladata tiedostoja?
Hyvänä puolena ongelma on erittäin helppo korjata joko välittömästi pakottamalla selain ymmärtämään tiedostot UTF-8 koodatuiksi tai luultavasti hyvin pian kun ftp.drupal.org -palvelimen konfiguraatiota korjataan. Tein tästä issuen webmastereiden työjonoon: http://drupal.org/node/1061336
Enkoodausongelma po-tiedoston tuonnissa?
Kokeilin ja esim. http://ftp.drupal.org/files/translations/7.x/drupal/drupal-7.0.fi.po :n lataamisessa ääkköset näkyivät oikein (UTF-8-järjestelmä/fi_FI.UTF-8, Linux, Opera), mutta kuitenkin siellä oli rivejä kuten:
msgid "Form element to edit the data."
msgstr "Sy"
msgid "Maximum number of values users can enter for this field."
msgstr "Sy"
Arvelisin näin ongelman olleen po-tiedostoa tuotaessa täällä localize.drupal.org:ssa. Esim. "Form element to edit the data.":n käännöksen lähde on tuntematon. Voisiko viitata siihen, että se on tuotu suoraan po-tiedostosta?
Missä merkistössä drupal.org olettaa tuotavien po-tiedostojen olevan?
D merkistöt
Drupalin kanssa on aika yleisesti UTF-8, erikseen tätä tarkastamatta olettaisin sen pätevän myös po-importtiin. Voihan se olla että käännöstiedostoja on importoitu väärillä merkistöillä ja ne ovat tällöin menneet rikki. Kuitenkin myös ladattavien tiedostojen merkistö on nyt määrittelemätön, joten jokainen selain päättää ihan itse fiilispohjalta mitä merkistöä käyttää. Olettaisin että korjausta kaivataan nyt molemmissa päissä. Jos ongelma on yleisempikin voin pyytää Gáboria tekemään pientä search & replacea suoraan l.d.o:n käännöskannassa kun kyse on suurella todennäköisyydellä vain rikkinäisistä äöåÄÖÅ -merkeistä.
Drupal 7:n päivitystyökalulla
Drupal 7:n päivitystyökalulla noita on haettu. Sen lisäksi Ubuntun FF 3.6:lla, ja Opera 11:lla.
Mutta ongelma siis ei ole ääkkösten puuttuminen tai sotekutuminen, vaan se että osa stringeitä katkeaa ensimmäiseen ääkköseen joka tulee vastaan. Eli vaikkaisin että vika on ennen kuin selain tulee mukaan kuvioihin.
+ vielä se että tiedoston rivi ei katkea, vaan lainaiusmerkkien sisällä oleva teksti. Eli rivit alkavat ja päättyvät oikein, mutta data ei ole oikeaa.
Annatko esimerkkejä
Katselin esimerkiksi tuota mainitsemaasi D7:n po-pakettia, mutta en löytänyt selaamalla katkenneita stringejä siitä. Rikkinäisiä skandeja runsaasti, katkonaisia ei niinkään. Pystytkö tarkistamaan olivatko merkkijonot poikki jo .po -tiedostossa vai vasta kun olit ladannut sen jo käyttöliittymään?
Aika kriittinen ongelma selvittää nyt kun l.d.o siirtyy tällä viikolla Git migraation myötä ainoaksi paikaksi hakea mitään käännöksiä.
D7
Minäkään en tuosta D7:n paketista katkenneita stringejä löytänyt (lieneekö jokin korjaantunut jossain?), mutta en kyllä rikkinäisiä skandejakaan. Linux, wget, utf-8 oli käytössä. D6:n cck-paketeissa niitä näytti olevan vielä.
Re: Enkoodausongelma
Wgetillä koitin linuxilla ja Chromella OS X:llä. Mutta kuten muissa kommenteissa on valotettu, ongelma tuskin on täällä lataajan päässä vaan jossain aiemmassa vaiheessa. Jos se olisi täällä päässä, merkit näkyisivät jonain sotkuna, mutta nyt käännökset tosiaan katkeavat lainausmerkkien sisältä.
Mahtoiko jo korjaantua?
Näkyisi nämä pätkivät katoavan, ainakaan itse en enää näitä löytänyt. Liekkö joku tilapäinen ongelma joka on korjaantunut kun käännöspaketteja on tehty uusiksi.
Joo mä käänsin ainakin CCK:n
Joo mä käänsin ainakin CCK:n threadit uusiksi siltä osin mitkä oli rikkoutuneet