close

中文翻越南文

以例一說明:

兩個案例完滿是我依照理論推導出來了,未經證實。
有類似經歷的歡迎指摘指正。

 簡體中文:化六個結論

1. charset

 4、Access2000

word裡的繁簡轉換,簡體轉換到繁體後,內碼還是簡體中文的,其實只是簡體中的繁體字。




2.bmp

 案例1
簡體中文系統下跑的好好的代碼,放到國外空間上,資料庫裡亂碼,原本的資料也亂碼。
剖析:因為大多半人日常平凡用的都是簡體中文系統,默許的codepage=936,所以日常平凡大家不寫也沒有關係翻譯
但到了國外空間問題就出來了翻譯從資料庫裡的Unicode轉換到 英文編碼去了,所以資料庫原有的簡體中文轉換到英文後,按GB顯示天然亂碼。
如圖,新輸入的文字顯示正常,但資料庫裡保存的是英文的 Unicode的。
解決方式:全數加上<%@codepage=936便可%>
全程只有簡體中文與對應Unicode間的 轉換。

換用Arial Unicode MS 字體就可以全數顯示了。(access扶助,搜刮,輸入unicode,有申明)

 相幹的題外話:


看到兩個重點:

Unicode10 進制情勢:&#21270;&#20845;&#20010;&#32467;&#35770;

codepage=936,那麼資料庫留存的就是簡體中文的Unicode(資料庫拿回簡體中文系統,一切正常的),codepage=950 留存的就是繁體中文的Unicode.(拿回簡體中文系統,就不對了)。


 3、網頁的textarea

 codepage指定了IIS按什麼編碼讀取傳遞過來的串串(表單提交,地址欄傳遞等)翻譯

 轉換:系統自動的轉換,比如從Unicode的“化”字到Big5的“化”字,內碼釀成Big5翻譯假如Big5沒有對應的字,保存Unicode 情勢(&#xxxx;



3.bmp


<%@ codepage=936%> charset=GB2312

3.read.asp 從資料庫獲得留言,顯示。

若是資料視圖查看有些字元不正常,那是因為顯示所用的字體不是Unicode字體,

<%@ codepage=950%>

例一:

歡迎來批啊。以下都是我的想法,哪裡有不對的請不吝賜教,幫忙指出來。

3.注意一下串串的轉變進程:

1)輸入法---CharsetUnicode----指定字元集的映照
2)Charset----
表單編碼串串簡單編碼
3)
表單 解碼上步的逆過程,兩步抵消了翻譯
4)
串串àcodepage讀取串串沒變,這步有可能誤會讀取
5)
轉為對應的Unicode Codepage指定字元集----Unicode映射
6)
中心處置,進資料庫無轉變,直接以Unicode情勢進入
7)
codepage讀取資料庫Unicode----codepage指定字元集的映照
8)
顯示,按Charset指定字元集讀取串串沒變。

<%@ codepage=936%>簡體中文

 案例二:
簡體中文的代碼和資料,想轉為完全的繁體版,該怎麼辦?
剖析:1翻譯代碼檔編碼全數改 為Big5的,檔本身保存編碼選繁體。
2
<%@ codepage=936 %>
3.Charset=big5
4.access
版本無所謂,因為access裡的資料是Unicode的。
5.
好了,代碼可以在純繁系統統下跑了翻譯
6.
遺留問題:原有的簡體中文資料讀 出會有一些問號。結果同例一的950讀取,big5顯示。因為從簡體中文的Unicode轉換到繁體中文了,有些字繁體中沒有,就會出問號翻譯
7.
解決:用一個且則asp頁,codepage=65001,讀出為簡體中文的Unicode,用一個Unicode->Big5的函數,轉為繁體中 文,然後寫回資料庫,應當行了吧?

 一、作業系統

 也指定了所有文本變數從Unicode轉換到的編碼,

論壇的相幹會商:http://www.blueidea.com/bbs/NewsDetail.asp?id=1831362

是指定IIS要用什麼編碼讀取傳過來的網頁資料, 也就指定了從資料庫 取出的資料從Unicode轉換到的編碼

 下麵舉例說明:

這幾天研究UTF-8編碼,太暈了,把
天成翻譯公司的看法和列位討論接頭翻譯

讀取:一個串串,按簡體讀取是一些字,按繁體讀取是一些字,串串本身編碼沒有變。

到這裡發現了什麼?
1
.若是輸入的文字和Charset對應的分歧,一轉換,便可能泛起Unicode形式的字了翻譯這裡就是緣由所在。今後 全部過程都保留著。
2
.Add.asp裡codepage決意了留存到資料庫的文字,用的是哪一個說話對應的Unicode.

<%@ codepage=950%>繁體中文
2. codepage

假定有三個asp頁面,典型的留言頁面:

例二:

<%@ codepage=65001%>UTF-8

<%@ codepage=950%> charset=big5

 二、輸入法:

把例一的add.asp<%@codepage=936%>改為<%@ codepage=950%>,又會怎麼樣呢?



4.bmp

<%@ codepage=950%>繁體中文

用戶端:輸入法Unicode--輸入框unicode--Unicodecharset轉換到對應編碼()--表單發送編碼

 大師可以猜一猜,天成翻譯公司write.asp裡用微軟拼音輸入法輸入“化六個接洽”翻譯最後在read.asp裡會顯示什麼樣?

Unicode16進制情勢:&#x5316;&#x516d;&#x4e2a;&#x7ED3;&#x8bba;

window系統內部都是unicode翻譯資料夾名,檔案名等都是unicode的,任何說話系統下都能正常顯示。

 5、Word

1.write.asp 簡單的輸入表單,提交到add.asp

暈了。目前來用用常識。

 伺服器端:IIS解開表單編碼--codepage指定編碼讀取--轉換到對應的Unicode--可以用request("")讀取了--進行一些處置懲罰--Unicode編碼保留到資料庫

<METAhttp-equiv="Content-Type" content="text/html;charset=big5">

微軟拼音輸出的是Unicode的,聰明ABC輸出是簡體中文的(所以智慧ABC在非簡體中文系統底子不克不及用,只能打英文)翻譯



1.bmp



例二:

 6、ASP內部是Unicode的,所有文本都是Unicode存儲的。需要時轉換到指定字元集。

<%@ codepage=65001%>UTF-8

<METAhttp-equiv="Content-Type" content="text/html;charset=big5">

2.add.asp 接收留言,留存到資料庫

也就指定了從資料庫取出的資料從Unicode轉換到的編碼。(留意這個,很重要翻譯

 起首說下結論:

 伺服器端:讀取資料庫的Unicode資料,轉換到codepage指定編碼---生成原始程式碼--IEcharset讀取顯示。

是將表單資訊編碼用的翻譯社 編為指定的碼後再傳給伺服器使用, 或將伺服器傳來的資料編碼後顯示

<%@ codepage=936%>簡體中文

<%@ codepage=936%>

 要害字:

是否是暈了。讓我們從頭闡明。

網頁的textarea是用unicode顯示的。所以往裡打什麼字都能顯示翻譯而一些flash做的輸入框就不可了。


資料濫觞:BlueIdea

access裡面保留的資料是unicode的,在任何說話系統下都能顯示。



5.bmp

 下麵是我猜度出來的編碼轉換的進程:



文章出自: http://mypaper.pchome.com.tw/nut0322/post/1320932895有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931

arrow
arrow
    文章標籤
    翻譯社
    全站熱搜
    創作者介紹
    創作者 elsier08ei5 的頭像
    elsier08ei5

    這裡是和天成翻譯有關的地盤,歡迎到訪我的BLOG!

    elsier08ei5 發表在 痞客邦 留言(0) 人氣()