[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列

本文主要是介绍[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

各语言字符编码

回忆上次内容

  • 上次回顾了 非ascii的拉丁字符编码的进化过程
    • 0-127 是 ascii 的领域
  • 西欧、北欧语言 大多使用 拉丁字符
    • 由iso组织 制定iso-8859-1

图片描述

  • 北欧原来
    • 不是有自己的卢恩符文系统(Runes)吗?

卢恩文字

  • 曾在下述地区 被真实使用
    • 日德兰半岛
    • 斯堪的纳维亚半岛
    • 不列颠群岛
  • 论文符文 出现在
    • 耶灵石
    • 武器铭文
    • 护身符

图片描述

  • 蓝牙王
    • 统一 挪威、瑞典和丹麦
  • 八字胡王
    • 政府不列颠
  • 克努特大帝
    • 更曾统一北海
  • 为什么 武功赫赫的维京人曾用的 卢恩符文系统
    • 没被留下来 呢?

由来

  • 拉丁字符的基础
    • 罗马帝国的强大
    • 基督教的传播
      • 不列颠和北欧 逐渐都 皈依了基督教

图片描述

  • 圣经
    • 原文翻译成 拉丁文 并得到广泛传播
    • 使用的是 拉丁字符
  • 君士坦丁大帝 对教会很友善
    • 天主教教宗 根在 西罗马帝国梵蒂冈
  • 欧洲 最先搞活字 印圣经的谷腾堡
    • 字体是 日耳曼地区的BlackLetter
      • 被 阿尔卑斯山以南 佛罗伦萨等地居民
      • 嘲笑为哥特风格
        • Goth 今天 也有野蛮的意思

拉丁语

  • 意大利 自有 罗马传统字体

    • Roman正字
    • Italy斜体
  • 虽然 拉丁字符 人人都用

    • 而且 都是 很常用的字体
  • 但是 今天的拉丁语

    • 得加上一个古字
  • 世界上 使用拉丁语的国家 只有梵蒂冈

    • 位于 罗马西北方 高地之上
  • 拉丁语嫡系

    • 意大利语
  • 拉丁语旁系

    • 西班牙语
    • 葡萄牙语
    • 法语

图片描述

  • 西欧、北欧
    • 最后都用 拉丁字符
    • 但 一个字节 也填满了
  • 南欧、东欧
    • 使用 什么字符 呢?

斯拉夫语族

  • 东斯拉夫语支
    • 俄语
    • 乌克兰语
    • 白俄罗斯语
  • 西斯拉夫语支
    • 波兰语
    • 捷克语
    • 斯洛伐克语
    • 索布语
  • 南斯拉夫语支
    • 保加利亚语
    • 斯洛文尼亚语
    • 克罗地亚语
    • 马其顿语
    • 塞尔维亚语
    • 黑山语

图片描述

  • 面积很广
  • 斯拉夫语用什么字符呢?

西里尔字符

  • 斯拉夫语族 西斯拉夫语支
    • 索布语
    • 波兰语
    • 捷克语和斯洛伐克语
    • 以拉丁字母书写

图片描述

  • 斯拉夫语族 东斯拉夫语支
    • 俄罗斯语
    • 乌克兰语
    • 卢森尼亚语
    • 白俄罗斯语
    • 保加利亚语
    • 塞尔维亚语
    • 马其顿语等
  • 当地人平常就说这些话
    • 但是想要写下来
      • 就得用书写系统了
    • 使用西里尔字符
  • 什么是西里尔字符呢?

修典

  • 君士坦丁大帝 迁都君士坦丁堡 后
    • 政治中心和宗教中心 分离
    • 最终 东西罗马帝国 分家

图片描述

  • 东罗马

    • 向 斯拉夫语区传教
      • 派出传教士
  • 当地人

    • 愿意接受宗教文化影响
    • 但担心政治上的影响
    • 需要找到 拉丁字符之外的字符
    • 保持相对独立性

西里尔兄弟

  • 康斯坦丁(后称为西里尔)和美多德兄弟
    • 出生于希腊
    • 接收 东罗马帝国皇帝的指派
      • 在 斯拉夫语地区传教

图片描述

  • 在保加利亚 创建了西里尔字母cyrilice
    • 结合 当地的习惯
    • 撰写了 大摩拉维亚的法典
  • 后来 布道录《基辅文献》 和《布拉格片段》
    • 使用西里尔字符
    • 在 斯拉夫语地区 广泛传播
      • 为 当地民族文学 及 民间的宗教创作
        • 营造了前提
  • 拉丁字符 和 西里尔字符 越走越远
    • 东正教 最终与基督教 分道扬镳

三种字符比较

  • 古希腊的雕塑、哲学、医学等文化
    • 进入了罗马文明
  • 马其顿王国 被罗马帝国征服后
    • 希腊半岛的军事力量
      • 臣服于 意大利半岛

图片描述

  • 西里尔文字 收到 希腊文字影响
    • 文化 也受到 罗马、希腊文化影响

汉语拼音

  • 当时 前苏联 是我国老大哥
    • 就连 外语学的 都是俄语
    • 也曾计划 用西里尔字母 作为汉语拼音字母

图片描述

  • 后来 中苏关系紧张
    • 西里尔拼音方案 搁浅
    • 最后 将拉丁字符 定为 汉语拼音 字符
  • 这 西里尔字符
    • 应该如何编码呢?

总结

  • 罗马帝国 分成了东西罗马
    • 核心的位置 是 Christ 标志
      • xp
      • 后来发展成为了十字架

图片描述

  • 这个 西里尔字符

    • 应该 如何编码呢?🤔
  • 我们下次再说!👋

  • 蓝桥->https://www.lanqiao.cn/courses/3584

  • github->https://github.com/overmind1980/oeasy-python-tutorial

  • gitee->https://gitee.com/overmind1980/oeasypython

这篇关于[oeasy]python0115_西里尔字符集_Cyrillic_俄文字符编码_KOI_8859系列的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/overmind/article/details/129743186
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/222790

相关文章

C#如何去掉文件夹或文件名非法字符

《C#如何去掉文件夹或文件名非法字符》:本文主要介绍C#如何去掉文件夹或文件名非法字符的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#去掉文件夹或文件名非法字符net类库提供了非法字符的数组这里还有个小窍门总结C#去掉文件夹或文件名非法字符实现有输入字

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

idea报错java: 非法字符: ‘\ufeff‘的解决步骤以及说明

《idea报错java:非法字符:‘ufeff‘的解决步骤以及说明》:本文主要介绍idea报错java:非法字符:ufeff的解决步骤以及说明,文章详细解释了为什么在Java中会出现uf... 目录BOM是什么?1. BOM的作用2. 为什么会出现 \ufeff 错误?3. 如何解决 \ufeff 问题?最

使用Java编写一个字符脱敏工具类

《使用Java编写一个字符脱敏工具类》这篇文章主要为大家详细介绍了如何使用Java编写一个字符脱敏工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、字符脱敏工具类2、测试工具类3、测试结果1、字符脱敏工具类import lombok.extern.slf4j.Slf4j

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

VSCode中C/C++编码乱码问题的两种解决方法

《VSCode中C/C++编码乱码问题的两种解决方法》在中国地区,Windows系统中的cmd和PowerShell默认编码是GBK,但VSCode默认使用UTF-8编码,这种编码不一致会导致在VSC... 目录问题方法一:通过 Code Runner 插件调整编码配置步骤方法二:在 PowerShell

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常

C# string转unicode字符的实现

《C#string转unicode字符的实现》本文主要介绍了C#string转unicode字符的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随... 目录1. 获取字符串中每个字符的 Unicode 值示例代码:输出:2. 将 Unicode 值格式化