026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记

本文主要是介绍026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 在 C# 中,内存中的所有字符串都是按 Unicode (UTF-16) 编码的。将数据从存储器移动到 string 对象中后,数据将自动转换为 UTF-16。如果数据仅包含从 0 到 127 的 ASCII 值,则此转换无需您执行任何额外的工作。但若源文本包含扩展的 ASCII 字节值(128 到 255),则默认情况下,将根据当前代码页解释扩展字符。若要指定应该根据其他某个代码页解释源文本,请使用 System.Text..::.Encoding 类,如下面的示例所示。

下面的示例演示如何转换按 8 位 ASCII 编码的文本文件

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;
//yngqq@2024年9月3日15:22:45
namespace ConsoleApp1
{class ANSIToUnicode{static void Main(){// Create a file that contains the Greek work ψυχή (psyche) when interpreted by using // code page 737 ((DOS) Greek). You can also create the file by using Character Map // to paste the characters into Microsoft Word and then "Save As" by using the DOS// (Greek) encoding. (Word will actually create a six-byte file by appending "\r\n" at the end.)//桌面自动生成一个txt文件,写入字节。string mypath = @"C:\Users\Administrator\Desktop\greek.txt";System.IO.File.WriteAllBytes(mypath, new byte[] { 0xAF, 0xAC, 0xAE, 0x9E });// Specify the code page to correctly interpret byte values//此外,对于一些常用的字符编码(如UTF-8、Unicode等),C#还提供了更直接的获取方式,如 Encoding.UTF8 或 Encoding.Unicode。然而,对于特定语言或地区的字符编码,如希腊语(代码页737),/则需要使用 GetEncoding 方法指定代码页编号来获取。Encoding encoding = Encoding.GetEncoding(737); //(DOS) Greek code page// Encoding encoding = Encoding.ASCII ;  //也可以用其他编码方式读取                                    string mypath1 = @"C:\Users\Administrator\Desktop\1.txt";//读取字节文件byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);//byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);// Same content is now encoded as UTF-16//用希腊编码737方式读取文本string unicodeValues = encoding.GetString(codePageValues);// Show that the text content is still intact in Unicode string// (Add a reference to System.Windows.Forms.dll)Console.WriteLine(unicodeValues);// Same content "ψυχή" is stored as UTF-8//转换编码后输出到1.txtSystem.IO.File.WriteAllText(mypath1, unicodeValues);// Conversion is complete. Show the bytes to prove the conversion. Console.WriteLine("8-bit encoding byte values:");foreach (byte b in codePageValues)Console.Write("{0:X}-", b);Console.WriteLine("\n");Console.WriteLine("Unicode values:");//需要在桌面建一个2.txt文件string mypath2 = @"C:\Users\Administrator\Desktop\2.txt";string mypath3 = @"C:\Users\Administrator\Desktop\3.txt";string mypath4 = @"C:\Users\Administrator\Desktop\4.txt";//读取桌面的已有文件2.txtstring unicodeString2 = System.IO.File.ReadAllText(mypath2);byte[] code4 = System.IO.File.ReadAllBytes(mypath2);string unicode4 = encoding.GetString(code4);System.IO.File.WriteAllText(mypath4, unicode4);System.Globalization.TextElementEnumerator enumerator =System.Globalization.StringInfo.GetTextElementEnumerator(unicodeString2);//另一种转换方法while (enumerator.MoveNext()){string s = enumerator.GetTextElement();//转换编码方式int i = Char.ConvertToUtf32(s, 0);Console.Write("{0:X}-", i);}Console.WriteLine();System.IO.File.WriteAllText(mypath3, unicodeValues);// Keep the console window open in debug mode.Console.Write("Press any key to exit.");Console.ReadKey();}}}

这篇关于026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1135545

相关文章

java Long 与long之间的转换流程

《javaLong与long之间的转换流程》Long类提供了一些方法,用于在long和其他数据类型(如String)之间进行转换,本文将详细介绍如何在Java中实现Long和long之间的转换,感... 目录概述流程步骤1:将long转换为Long对象步骤2:将Longhttp://www.cppcns.c

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

Java SWT库详解与安装指南(最新推荐)

《JavaSWT库详解与安装指南(最新推荐)》:本文主要介绍JavaSWT库详解与安装指南,在本章中,我们介绍了如何下载、安装SWTJAR包,并详述了在Eclipse以及命令行环境中配置Java... 目录1. Java SWT类库概述2. SWT与AWT和Swing的区别2.1 历史背景与设计理念2.1.

Redis过期删除机制与内存淘汰策略的解析指南

《Redis过期删除机制与内存淘汰策略的解析指南》在使用Redis构建缓存系统时,很多开发者只设置了EXPIRE但却忽略了背后Redis的过期删除机制与内存淘汰策略,下面小编就来和大家详细介绍一下... 目录1、简述2、Redis http://www.chinasem.cn的过期删除策略(Key Expir

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

C#如何去掉文件夹或文件名非法字符

《C#如何去掉文件夹或文件名非法字符》:本文主要介绍C#如何去掉文件夹或文件名非法字符的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#去掉文件夹或文件名非法字符net类库提供了非法字符的数组这里还有个小窍门总结C#去掉文件夹或文件名非法字符实现有输入字

C#之List集合去重复对象的实现方法

《C#之List集合去重复对象的实现方法》:本文主要介绍C#之List集合去重复对象的实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C# List集合去重复对象方法1、测试数据2、测试数据3、知识点补充总结C# List集合去重复对象方法1、测试数据

C#实现将Office文档(Word/Excel/PDF/PPT)转为Markdown格式

《C#实现将Office文档(Word/Excel/PDF/PPT)转为Markdown格式》Markdown凭借简洁的语法、优良的可读性,以及对版本控制系统的高度兼容性,逐渐成为最受欢迎的文档格式... 目录为什么要将文档转换为 Markdown 格式使用工具将 Word 文档转换为 Markdown(.

SpringBoot整合Apache Flink的详细指南

《SpringBoot整合ApacheFlink的详细指南》这篇文章主要为大家详细介绍了SpringBoot整合ApacheFlink的详细过程,涵盖环境准备,依赖配置,代码实现及运行步骤,感兴趣的... 目录1. 背景与目标2. 环境准备2.1 开发工具2.2 技术版本3. 创建 Spring Boot

Python远程控制MySQL的完整指南

《Python远程控制MySQL的完整指南》MySQL是最流行的关系型数据库之一,Python通过多种方式可以与MySQL进行交互,下面小编就为大家详细介绍一下Python操作MySQL的常用方法和最... 目录1. 准备工作2. 连接mysql数据库使用mysql-connector使用PyMySQL3.