| 网站首页 | VB.Net实例分析 | .Net技术文摘 | 下载中心 | VB.Net书籍笔记 | .Net源码 | VBS脚本与组件调用 | Windows2008技术文摘 | 给我们留言 | 
最新公告:

  没有公告

您现在的位置: 乐博网 >> VB.Net开发技巧 >> 技术文摘正文
最新推荐 更多内容
VB.Net转换Unicode字符串为UTF-8的方法
VB.Net转换Unicode字符串为UTF-8的方法
作者:Iva    来源:乐博网     更新时间:2009-8-1

 

代码如下:

 Imports System.Text 

    Public Function StringAsUtf8Bytes(ByVal strData As String) As Byte()

       Dim bytes() As Byte

        bytes = Encoding.UTF8.GetBytes(strData)

        Return bytes

  End Function

为了更好理解utf8的优势,乐博网附带了关于UTF8的介绍:

UTF8并不算是一种电脑编码,而是一种储存和传送的格式,如前所述,每个Unicode/UCS字符都以 2或4个bytes来储存,看看以下的比较:

  以"I am Chinese"为例

  用ANSI储存:12 Bytes

  用Unicode/UCS2储存:24 Bytes + 2 Bytes(header)

  用UCS4储存:48 Bytes + 4 Bytes(header)

  以"我是中国人"为例

  用ANSI储存:10 Bytes

  用Unicode/UCS2储存:10 Bytes + 2 Bytes(header)

  用UCS4储存:20 Bytes + 4 Bytes(header)

  由此可见直接以Unicode/UCS的原始形式来储存是一种极大的浪费,而且也不利于互联网的传输(中文稍为合算一点^_^)。

  有见及此,Unicode/UCS的压缩形式--UTF8出现了,套用官方网站的首句话『UTF-8 stands for Unicode Transformation Format-8. It is an octet (8-bit) lossless encoding of Unicode characters.』,由于UTF也适用于编码UCS,故亦可称为『UCS transformation formats (UTF)』

  UTF8是以8bits即1Bytes为编码的最基本单位,当然也可以有基于16bits和32bits的形式,分别称为UTF16和UTF32,但目前用得不多,而UTF8则被广泛应用在文件储存和网络传输中。

  • 上一篇:

  • 下一篇:
  • 【字体: 】【打印此文】【关闭窗口
      相关文章:(只显示最新16条)
    VB.NET十六进制与八进制相互转化的方法
    VB.NET二进制与八进制相互转化的方法
    VB.NET十进制与八进制相互转化的方法
    VB.NET将十进制转化为十六进制的方法
    VB.NET将十六进制转化为十进制的方法
    VB.NET将二进制转化为十六进制的方法
    VB.NET将十六进制转化为二进制的方法
    VB.NET将二进制转化为十进制的方法
    VB.NET将十进制转化为二进制的方法
    VB.Net像素与毫米转换的方法
    VB.NET将字节数组转换为字符串的方法
    VB.Net转换时间/日期值为字符串的方法

    | 设为首页 | 加入收藏 | 联系站长 | | 友情链接 | 版权申明 |
    乐博网欢迎各种媒体转载我们的原创作品[转载请注明出处];我们鼓励更多VB.Net开发者一起加入研究与探讨;如发现文章访问错误、内容错误或版权疑问、内容有违相关法律(如涉及政治、色情、反动或散布虚假有害信息)等情况,请及时向我们举报,我们将及时纠正!
    联系邮箱:Shiny#vip.qq.com (#替换为@) QQ交流群: 40797788 [闽ICP备05014267号]