<html><head><meta http-equiv="Content-Type" content="text/html charset=iso-8859-1"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">There is now a decisions page -- and this is logged on it<div><br></div><div><a href="http://wiki.gpii.net/index.php/DECISIONS_LOG">http://wiki.gpii.net/index.php/DECISIONS_LOG</a></div><div><br></div><div><br><div apple-content-edited="true">
<div style="color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div style="color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; border-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; border-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; border-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; border-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; border-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><i>Gregg</i><br><div>--------------------------------------------------------<br><div>Gregg Vanderheiden Ph.D.<br>Director Trace R&D Center<br>Professor Industrial & Systems Engineering<br>and Biomedical Engineering University of Wisconsin-Madison<br></div>Technical Director - Cloud4all Project - <a href="http://Cloud4all.info">http://Cloud4all.info</a><br>Co-Director, Raising the Floor - International - <a href="http://Raisingthefloor.org">http://Raisingthefloor.org</a><br>and the Global Public Inclusive Infrastructure Project -  <a href="http://GPII.net">http://GPII.net</a></div></div></span></div></span></div></span></div></span></div></span></div></span></div></div>
</div>
<br><div><div>On Oct 23, 2012, at 7:56 AM, Christophe Strobbe <<a href="mailto:strobbe@hdm-stuttgart.de">strobbe@hdm-stuttgart.de</a>> wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">Hi,<br><br>I was ill last week, so I'm catching up now. I have not seen any comments<br>on objections on this proposal, so I have marked it as accepted by common<br>consent on the wiki (with links to the calls for comments etc).<br>See<br><<a href="http://wiki.gpii.net/index.php/Discussion_on_Profile_Structure#Language_Codes">http://wiki.gpii.net/index.php/Discussion_on_Profile_Structure#Language_Codes</a>>.<br><br>When we have a separate Decisions page, we can reference this decision<br>from there.<br><br>Best regards,<br><br>Christophe<br><br><br>Am Do, 11.10.2012, 20:57 schrieb Christophe Strobbe:<br><blockquote type="cite"><br>Hi,<br><br>I have not seen any objections to the proposal to use IETF BCP 47 as the<br>standard for the term "language" in the Registry. I have collected some of<br>the content of the discussions (and some additional information) in the<br>wiki page at<br><<a href="http://wiki.gpii.net/index.php/Discussion_on_Profile_Structure#Language_Codes">http://wiki.gpii.net/index.php/Discussion_on_Profile_Structure#Language_Codes</a>>,<br>and below in this message (for the links, please read the version in the<br>wiki). I would like to give you some time to review this, so we can reach<br>consensus on this. If there are no objections by Monday evening (15<br>October) I will assume that we have reached consensus. If any<br>clarifications are needed, please let me know as soon as possible.<br><br>Best regards,<br><br>Christophe Strobbe<br><br><br>The text from the wiki page:<br><br><br>One of the terms in the current version of the Registry is language<br>(description: "a preference for the language of the user interface"). The<br>value space is tentatively defined as the values defined by ISO 639-2/T.<br>ISO 639-2/T identifies languages by means of three-letter codes (instead<br>of the ISO 639-1 two-letter codes that are commonly used in HTML pages)<br>without a means of identifying variants (see also the list of ISO 639-2<br>codes on Wikipedia).<br><br>Proposal:<br><br>Use IETF BCP 47 instead of ISO 639-2/T as the format for identifying<br>languages.<br>* BCP 47 defines a language tag is consisting of a primary language<br>subtag, followed by several optional subtags (especially for script,<br>region and/or variant).<br> - Scripts can be identified by means of codes defined by ISO 15924:2004.<br>For example, zh-Hans and zh-Hant have sometimes been used to distinguish<br>between Chinese with Simplified Characters and with Traditional<br>Characters, respectively. The registration authority for ISO 15924 tags<br>is the Unicode Consortium; see Codes for the representation of names of<br>scripts.<br> - Regions, including countries, can be identified by means of codes<br>defined by ISO 3166-1. An ISO 3166-1 decoding table is available on the<br>ISO website. The list of alpha-2 country codes (in TXT, HTML or XML) is<br>available free of charge for internal use and non-commercial purposes.<br>The full ISO 3166-1:2006, which also contains the alpha-3 codes and the<br>numeric codes, is not available free of charge.<br>* BCP 47 allows the use of three-letter codes for primary language tags<br>defined by ISO 639-3. The registration authority for ISO 639-3 tags is SIL<br>International; see ISO 639-3 Registration Authority. Using ISO 639-3 has<br>several advantages:<br> - This list is more complete than ISO 639-1 and ISO 639-2.<br> - ISO 639-3 provides more precision for the identification of languages:<br>some of the ISO 639-1 codes actually referred to macrolanguages, for<br>example zh (Chinese) and ar (Arabic). The ISO 639-3 list distinguishes<br>between macrolanguages and sublanguages, for example zho (Chinese) has<br>sublanguages such as cmn (Mandarin), hak (Hakka) and yue (Yue or<br>Cantonese). These distinctions can trigger different Braille conversion<br>tables or text-to-speech engines (e.g. Ekho supports Cantonese, Mandarin<br>and Zhaoan Hakka), so these distinctions are relevant to accessibility.<br>See the ISO 639-3 Macrolanguage Mappings.<br> - Three letter codes also allow us to identify sign languages. ISO 639-2<br>contains the tag "sgn" for sign language (which would need to be refined<br>with subtags), and ISO 639-3 contains tags for individual sign languages,<br>such as ase (American Sign Language), asf (Australian Sign Language) and<br>sgg (Swiss-German Sign Language). ISO 639-1, by contrast, contained no<br>tags to identify sign languages.<br>* BCP 47 is also the standard for values of lang and xml:lang in HTML5.<br>* ISO standards can use IETF RFCs and BCPs as normative references.<br><br>Note:<br>* While the set of languages supported by assistive technologies is only a<br>very small subset of the (over 5000) living languages, it is also<br>important to support the matching of resources in specific languages<br>(including subtitles, captions, etc) with languages that a user<br>understands, and this is probably a much wider range than what is<br>supported by AT.<br>* Implementations would need to synchronise their list of languages with<br>the list maintained by SIL International (the registration authority for<br>ISO 639-3), since language tags may be retired (see the Retired ISO 639-3<br>Codes).<br>* Implementations would need to synchronise their list of country codes<br>with the list maintained the ISO 3166 Maintenance Authority, since country<br>codes may be added or withdrawn (e.g. the country code for Yugoslavia was<br>withdrawn).<br>* There are a few special language codes:<br> - Content in an undetermined language can be tagged with 'und' (ISO 639-2<br>and ISO 639-3). BCP 47 points out that this tag should only be used if a<br>language tag is required.<br> - Content in an uncoded language can be tagged with 'mis' (ISO 639-2 and<br>ISO 639-3), i.e. the language is known but has no language code.<br> - Non-linguistic content can be tagged with 'zxx' (ISO 639-2 and ISO<br>639-3), i.e. sound recordings with only nonverbal sounds, instrumental<br>music, programming source code.<br> - Content in multiple languages can be tagged with 'mul' (ISO 639-2 and<br>ISO 639-3). BCP 47 points out that this tag "SHOULD NOT be used when a<br>list of languages or individual tags for each content element can be used<br>instead".<br> - There is no "default country code" for languages, so if content is<br>tagged with only "eng" (English), there is insufficient information to<br>decide, for example, whether an American, Canadian, British or Australian<br>Braille translation table should be used.<br> - The language tags described in IETF BCP 47 "are sequences of characters<br>from the US-ASCII [ISO646] repertoire". (This does not prohibit the use<br>of language tags in UTF-8 content. As Wikipedia points out: "The first<br>128 characters of Unicode, which correspond one-to-one with ASCII, are<br>encoded using a single octet with the same binary value as ASCII, making<br>valid ASCII text valid UTF-8-encoded Unicode as well.")<br><br><br><br><br>Am Fr, 5.10.2012, 17:09 schrieb Christophe Strobbe:<br><blockquote type="cite"><br>Am Do, 4.10.2012, 21:23 schrieb Gregg Vanderheiden:<br><blockquote type="cite">Great discussion<br><br>We need to have someone who will own this issue and manage it through<br>to<br>resolution.<br><br>Christophe, can you take ownership of this  -- and work with everyone<br>to<br>find a resolution?<br></blockquote><br><br>OK.<br>I currently consider IETF BCP 47 <<a href="http://tools.ietf.org/html/bcp47">http://tools.ietf.org/html/bcp47</a>> the<br>most appropriate standard to use for the "language" term in the<br>registry.<br>In addition to what I wrote in the last two days, BCP 47 is also the<br>format for the lang and xml:lang attributes in the current HTML5 draft:<br><<a href="http://www.w3.org/TR/html5/global-attributes.html#the-lang-and-xml:lang-attributes">http://www.w3.org/TR/html5/global-attributes.html#the-lang-and-xml:lang-attributes</a>>.<br>If anybody wants to speak against using IETF BCP 47 to define the value<br>space for "language" in the registry, please do so by Tuesday evening<br>next<br>week (10 October).<br><br>Best regards,<br><br>Christophe Strobbe<br><br><br><blockquote type="cite"><br><br>Gregg<br>--------------------------------------------------------<br>Gregg Vanderheiden Ph.D.<br>Director Trace R&D Center<br>Professor Industrial & Systems Engineering<br>and Biomedical Engineering<br>University of Wisconsin-Madison<br><br>Technical Director - Cloud4all Project - <a href="http://Cloud4all.info">http://Cloud4all.info</a><br>Co-Director, Raising the Floor - International<br>and the Global Public Inclusive Infrastructure Project<br><a href="http://Raisingthefloor.org">http://Raisingthefloor.org</a>   ---   <a href="http://GPII.net">http://GPII.net</a><br><br><br><br><br><br><br><br><br><br>On Oct 4, 2012, at 6:48 AM, Christophe Strobbe<br><<a href="mailto:strobbe@hdm-stuttgart.de">strobbe@hdm-stuttgart.de</a>><br>wrote:<br><br><blockquote type="cite"><br>A few things to bear in mind before making this decision:<br>1. ISO 639-2 (or any other part of ISO 639) just covers the codes for<br>the<br>identification of languages, not subcodes for countries, scripts, etc.<br>2. IETF RFC 4646 describes how to combine ISO 639 language codes with<br>ISO<br>3166 country codes (and other optional subtags), but prefers<br>two-letter<br>language codes over three-letter codes if the former type of code is<br>available. So that would gives us en-CA instead of eng-CA. So if we<br>want<br>to use codes like en-CA, we should refer to IETF RFC 4646; in order to<br>use<br>tags like eng-CA, we would need to invent our own "standard" for<br>language<br>codes. If we prefer IETF RFC 4646 tags, we will need to check if ISO<br>standards can use IETF RFCs as normative references.<br>3. The two-letter language code is what you find in HTML pages, the<br>OpenDocument format, and many other formats. That might be the reason<br>why<br>this type of code was in the sample preference sets. If we use<br>three-letter codes, some parts of the GPII/Cloud4all architecture will<br>need to refer to a table that maps two-letter codes to three-letter<br>codes,<br>because the two-letter codes seem to be the dominant convention (but<br>that<br>might change; e.g. Dublin Core seems to accept both types of codes).<br><br><br>I am not speaking against using codes like eng-CA, but we should know<br>what<br>the impact of this decision would be.<br><br><br>Best regards,<br><br>Christophe<br><br>Am Do, 4.10.2012, 07:18 schrieb Gregg Vanderheiden:<br><blockquote type="cite">OK<br><br><span class="Apple-tab-span" style="white-space:pre">     </span>Does anyone want to SPEAK AGAINST doing as Colin outlined which<br>seems<br>to<br>be in line with everyone else's comments.<br><br><span class="Apple-tab-span" style="white-space:pre">   </span>  If so please post any counter thoughts in the next few days.    We<br>have<br>everyone I think on the two lists attached so we can make a decision<br>if<br>there are no counter proposals to consider<br><br>thanks<br><br><br>Gregg<br>--------------------------------------------------------<br>Gregg Vanderheiden Ph.D.<br>Director Trace R&D Center<br>Professor Industrial & Systems Engineering<br>and Biomedical Engineering<br>University of Wisconsin-Madison<br><br>Technical Director - Cloud4all Project - <a href="http://Cloud4all.info">http://Cloud4all.info</a><br>Co-Director, Raising the Floor - International<br>and the Global Public Inclusive Infrastructure Project<br><a href="http://Raisingthefloor.org">http://Raisingthefloor.org</a>   ---   <a href="http://GPII.net">http://GPII.net</a><br><br><br>On Oct 3, 2012, at 10:44 PM, Colin Clark <<a href="mailto:colinbdclark@gmail.com">colinbdclark@gmail.com</a>><br>wrote:<br><br><blockquote type="cite">Hi all,<br><br>We should be using ISO 639-2 language codes throughout the system.<br>If<br>not, it's a bug.<br><br>If I remember correctly, this was probably introduced by the UI<br>Options<br>team who were integrating at very short notice with the GPII<br>framework.<br>I believe UI Options can support both two- and three-character<br>language<br>codes (as is often the case).<br><br>As a speaker of "eng-CA", I don't see any reason not to simply use<br>ISO<br>639-2 from the start and to also support country codes, as<br>Christophe<br>suggests. I also think it's probably worth supporting the<br>two-character<br>subset for interoperability if possible.<br><br>Colin<br><br>On 2012-10-03, at 1:18 PM, Gregg Vanderheiden wrote:<br><br><blockquote type="cite">I think that having language and country codes is a great idea.<br><br>Wd DO need to decide which codes to use.  I think the square<br>brackets<br>were because an official decision was not made yet<br><br>But I think using the ISO codes for both would be the right thing<br>to<br>do.  I added the arch list to see if someone knows  why two letter<br>codes are currently used.  (W3C?)<br><br>We also should say something like  "if no country is specified then<br>...."<br>(is there a default country for all languages specified somewhere?)<br>we might say the country of origin -- but I'm not sure all<br>languages<br>have an (existing) country of origin anymore.<br><br>Good catch Christophe.<br>Lets get a decision and then record it in the Glossary.<br><br>I wonder if we should have a decision registry somewhere since we<br>have<br>so many people involved.<br><br><br>Gregg<br>--------------------------------------------------------<br>Gregg Vanderheiden Ph.D.<br>Director Trace R&D Center<br>Professor Industrial & Systems Engineering<br>and Biomedical Engineering<br>University of Wisconsin-Madison<br><br>Technical Director - Cloud4all Project - <a href="http://Cloud4all.info">http://Cloud4all.info</a><br>Co-Director, Raising the Floor - International<br>and the Global Public Inclusive Infrastructure Project<br><a href="http://Raisingthefloor.org">http://Raisingthefloor.org</a>   ---   <a href="http://GPII.net">http://GPII.net</a><br><br><br>On Oct 3, 2012, at 11:43 AM, Christophe Strobbe<br><<a href="mailto:christophestrobbe@yahoo.co.uk">christophestrobbe@yahoo.co.uk</a>> wrote:<br><br><blockquote type="cite">Hi,<br><br>While creating a preference set for one of the personas in the<br>Cloud4all smarthouse simulation<br><<a href="http://wiki.gpii.net/index.php/SmartHouses_Preference_Sets">http://wiki.gpii.net/index.php/SmartHouses_Preference_Sets</a>>, I<br>looked<br>into language codes and found the following:<br>(1) ISO/IEC 24751:2008 (all subparts) refer to ISO 639-2:1998 for<br>language codes. In the registry, the value space for "language" is<br>[ISO 639-2/T] (I don't know the reason for the square brackets).<br>According to<br><<a href="https://en.wikipedia.org/wiki/List_of_ISO_639-2_codes">https://en.wikipedia.org/wiki/List_of_ISO_639-2_codes</a>><br>and <<a href="http://www.loc.gov/standards/iso639-2/php/code_list.php">http://www.loc.gov/standards/iso639-2/php/code_list.php</a>>, the<br>ISO<br>639-2 codes are three-letter codes (e.g. "eng" for English, "dut"<br>or<br>"nld" for Dutch, "fre" or "fra" for French, etc). However, the<br>JSON<br>preference sets I've seen so far (I mean those by the<br>GPII/Cloud4all<br>Architecture team) use two-letter codes (see Carla's, Nisha's and<br>Timothy's preference sets). Am I misreading the information I<br>found<br>about ISO 639-2?<br>(2) Related to this is the absence of country information, i.e.<br>combining a language code with a country code from ISO 3166 (see<br><<a href="http://www.loc.gov/standards/iso639-2/faq.html#22">http://www.loc.gov/standards/iso639-2/faq.html#22</a>>). This is<br>relevant<br>to text-to-speech engines and Braille. For example for Dutch, not<br>many<br>people in Flanders are keen on TTS that uses pronunciation rules<br>from<br>the Netherlands. Braille conventions also vary between countries<br>that<br>use the same official language (well, they even vary between<br>Braille<br>centres, but let's not go into that).<br>(3) Note that IETF RFC 4646 <<a href="http://tools.ietf.org/html/rfc4646">http://tools.ietf.org/html/rfc4646</a>><br>gives<br>preference to the shortest ISO 639 code (2 or three letters) that<br>is<br>available for a language (check the ABNF syntax under<br><<a href="http://tools.ietf.org/html/rfc4646#section-2.1">http://tools.ietf.org/html/rfc4646#section-2.1</a>>). This base code<br>can<br>then be combined with an ISO 3166 country code, to create tags<br>like<br>en-US (American English) and en-GB (British English). However,<br>IETF<br>RFC 4646 is referenced neither by ISO 24751 nor by the registry.<br><br>Best regards,<br><br>Christophe Strobbe<br><br></blockquote></blockquote><br>---<br>Colin Clark<br>Technical Lead, Fluid Project<br><a href="http://fluidproject.org">http://fluidproject.org</a><br></blockquote></blockquote><br>--<br>Christophe Strobbe<br></blockquote></blockquote><br><br>--<br>Christophe Strobbe<br><br>_______________________________________________<br>Accessforall mailing list<br></blockquote><br><br>--<br>Christophe Strobbe<br></blockquote><br><br>-- <br>Christophe Strobbe<br>Akademischer Mitarbeiter<br>Adaptive User Interfaces Research Group<br>Hochschule der Medien<br>Nobelstraße 10<br>70569 Stuttgart<br>Tel. +49 711 8923 2749<br><br>_______________________________________________<br>Architecture mailing list<br><a href="mailto:Architecture@lists.gpii.net">Architecture@lists.gpii.net</a><br>http://lists.gpii.net/cgi-bin/mailman/listinfo/architecture<br></blockquote></div><br></div></body></html>