[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列

本文主要是介绍[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

各语言字符编码

回忆上次内容

  • 上次回顾了 非ascii的拉丁字符编码的进化过程
    • 0-127 是 ascii 的领域
  • 西欧、北欧语言 大多使用 拉丁字符
    • 由iso组织 制定iso-8859-1

图片描述

  • 北欧原来
    • 不是有自己的卢恩符文系统(Runes)吗?

卢恩文字

  • 曾在下述地区 被真实使用
    • 日德兰半岛
    • 斯堪的纳维亚半岛
    • 不列颠群岛
  • 论文符文 出现在
    • 耶灵石
    • 武器铭文
    • 护身符

图片描述

  • 蓝牙王
    • 统一 挪威、瑞典和丹麦
  • 八字胡王
    • 政府不列颠
  • 克努特大帝
    • 更曾统一北海
  • 为什么 武功赫赫的维京人曾用的 卢恩符文系统
    • 没被留下来 呢?

由来

  • 拉丁字符的基础
    • 罗马帝国的强大
    • 基督教的传播
      • 不列颠和北欧 逐渐都 皈依了基督教

图片描述

  • 圣经
    • 原文翻译成 拉丁文 并得到广泛传播
    • 使用的是 拉丁字符
  • 君士坦丁大帝 对教会很友善
    • 天主教教宗 根在 西罗马帝国梵蒂冈
  • 欧洲 最先搞活字 印圣经的谷腾堡
    • 字体是 日耳曼地区的BlackLetter
      • 被 阿尔卑斯山以南 佛罗伦萨等地居民
      • 嘲笑为哥特风格
        • Goth 今天 也有野蛮的意思

拉丁语

  • 意大利 自有 罗马传统字体

    • Roman正字
    • Italy斜体
  • 虽然 拉丁字符 人人都用

    • 而且 都是 很常用的字体
  • 但是 今天的拉丁语

    • 得加上一个古字
  • 世界上 使用拉丁语的国家 只有梵蒂冈

    • 位于 罗马西北方 高地之上
  • 拉丁语嫡系

    • 意大利语
  • 拉丁语旁系

    • 西班牙语
    • 葡萄牙语
    • 法语

图片描述

  • 西欧、北欧
    • 最后都用 拉丁字符
    • 但 一个字节 也填满了
  • 南欧、东欧
    • 使用 什么字符 呢?

斯拉夫语族

  • 东斯拉夫语支
    • 俄语
    • 乌克兰语
    • 白俄罗斯语
  • 西斯拉夫语支
    • 波兰语
    • 捷克语
    • 斯洛伐克语
    • 索布语
  • 南斯拉夫语支
    • 保加利亚语
    • 斯洛文尼亚语
    • 克罗地亚语
    • 马其顿语
    • 塞尔维亚语
    • 黑山语

图片描述

  • 面积很广
  • 斯拉夫语用什么字符呢?

西里尔字符

  • 斯拉夫语族 西斯拉夫语支
    • 索布语
    • 波兰语
    • 捷克语和斯洛伐克语
    • 以拉丁字母书写

图片描述

  • 斯拉夫语族 东斯拉夫语支
    • 俄罗斯语
    • 乌克兰语
    • 卢森尼亚语
    • 白俄罗斯语
    • 保加利亚语
    • 塞尔维亚语
    • 马其顿语等
  • 当地人平常就说这些话
    • 但是想要写下来
      • 就得用书写系统了
    • 使用西里尔字符
  • 什么是西里尔字符呢?

修典

  • 君士坦丁大帝 迁都君士坦丁堡 后
    • 政治中心和宗教中心 分离
    • 最终 东西罗马帝国 分家

图片描述

  • 东罗马

    • 向 斯拉夫语区传教
      • 派出传教士
  • 当地人

    • 愿意接受宗教文化影响
    • 但担心政治上的影响
    • 需要找到 拉丁字符之外的字符
    • 保持相对独立性

西里尔兄弟

  • 康斯坦丁(后称为西里尔)和美多德兄弟
    • 出生于希腊
    • 接收 东罗马帝国皇帝的指派
      • 在 斯拉夫语地区传教

图片描述

  • 在保加利亚 创建了西里尔字母cyrilice
    • 结合 当地的习惯
    • 撰写了 大摩拉维亚的法典
  • 后来 布道录《基辅文献》 和《布拉格片段》
    • 使用西里尔字符
    • 在 斯拉夫语地区 广泛传播
      • 为 当地民族文学 及 民间的宗教创作
        • 营造了前提
  • 拉丁字符 和 西里尔字符 越走越远
    • 东正教 最终与基督教 分道扬镳

三种字符比较

  • 古希腊的雕塑、哲学、医学等文化
    • 进入了罗马文明
  • 马其顿王国 被罗马帝国征服后
    • 希腊半岛的军事力量
      • 臣服于 意大利半岛

图片描述

  • 西里尔文字 收到 希腊文字影响
    • 文化 也受到 罗马、希腊文化影响

汉语拼音

  • 当时 前苏联 是我国老大哥
    • 就连 外语学的 都是俄语
    • 也曾计划 用西里尔字母 作为汉语拼音字母

图片描述

  • 后来 中苏关系紧张
    • 西里尔拼音方案 搁浅
    • 最后 将拉丁字符 定为 汉语拼音 字符
  • 这 西里尔字符
    • 应该如何编码呢?

总结

  • 罗马帝国 分成了东西罗马
    • 核心的位置 是 Christ 标志
      • xp
      • 后来发展成为了十字架

图片描述

  • 这个 西里尔字符

    • 应该 如何编码呢?🤔
  • 我们下次再说!👋

  • 蓝桥->https://www.lanqiao.cn/courses/3584

  • github->https://github.com/overmind1980/oeasy-python-tutorial

  • gitee->https://gitee.com/overmind1980/oeasypython

这篇关于[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/222790

相关文章

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

Java 中编码与解码的具体实现方法

《Java中编码与解码的具体实现方法》在Java中,字符编码与解码是处理数据的重要组成部分,正确的编码和解码可以确保字符数据在存储、传输、读取时不会出现乱码,本文将详细介绍Java中字符编码与解码的... 目录Java 中编码与解码的实现详解1. 什么是字符编码与解码?1.1 字符编码(Encoding)1

C#如何去掉文件夹或文件名非法字符

《C#如何去掉文件夹或文件名非法字符》:本文主要介绍C#如何去掉文件夹或文件名非法字符的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#去掉文件夹或文件名非法字符net类库提供了非法字符的数组这里还有个小窍门总结C#去掉文件夹或文件名非法字符实现有输入字

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

idea报错java: 非法字符: ‘\ufeff‘的解决步骤以及说明

《idea报错java:非法字符:‘ufeff‘的解决步骤以及说明》:本文主要介绍idea报错java:非法字符:ufeff的解决步骤以及说明,文章详细解释了为什么在Java中会出现uf... 目录BOM是什么?1. BOM的作用2. 为什么会出现 \ufeff 错误?3. 如何解决 \ufeff 问题?最

使用Java编写一个字符脱敏工具类

《使用Java编写一个字符脱敏工具类》这篇文章主要为大家详细介绍了如何使用Java编写一个字符脱敏工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、字符脱敏工具类2、测试工具类3、测试结果1、字符脱敏工具类import lombok.extern.slf4j.Slf4j

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

VSCode中C/C++编码乱码问题的两种解决方法

《VSCode中C/C++编码乱码问题的两种解决方法》在中国地区,Windows系统中的cmd和PowerShell默认编码是GBK,但VSCode默认使用UTF-8编码,这种编码不一致会导致在VSC... 目录问题方法一:通过 Code Runner 插件调整编码配置步骤方法二:在 PowerShell