[iOS开发]Tagged Pointer对象

2023-10-24 04:50
文章标签 开发 对象 ios pointer tagged

本文主要是介绍[iOS开发]Tagged Pointer对象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

自2013年苹果推出iphone5s之后,iOS的寻址空间扩大到了64位。我们可以用63位来表示一个数字(一位做符号位)。那么这个数字的范围是2^63 ,很明显我们一般不会用到这么大的数字,那么在我们定义一个数字时NSNumber *num = @100,实际上内存中浪费了很多的内存空间。当然苹果肯定也认识到了这个问题,于是就引入了Tagged pointerTagged pointer是一种特殊的“指针”,其特殊在于,其实它存储的并不是地址,而是真实的数据和一些附加的信息。

原有系统的问题

我们先看看原有的对象为什么会浪费内存。假设我们要存储一个 NSNumber 对象,其值是一个整数。正常情况下,如果这个整数只是一个 NSInteger 的普通变量,那么它所占用的内存与CPU 的位数有关,在32位 CPU 下占4个字节,在64位CPU 下是占8个字节的。而指
针类型的大小通常也与 CPU 位数相关,一个指针所占用的内存在32 位 CPU 下为4个字节,在64位 CPU 下是8个字节。
所以,一个普通的 iOS程序,如果没有 Tagged Pointer 对象,从32位机器迁移到 64位机器中,虽然逻辑没有任何变化,但这种 NSNumberNSDate一类的对象所占用的内存会翻倍。请添加图片描述
我们再来看看效率上的问题,为了存储和访问一个 NSNumber 对象,我们需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期。这些都给程序增加了额外的逻辑,造成运行效率上的损失。

Tagged Pointer介绍

Tagged Pointer

为了改进上面提到的内存占用和效率问题,苹果提出了 Tagged Pointer 对象。由于 NSNumberNSDate一类的变量本身的值需要占用的内存大小常常不需要8个字节,拿整数来说,4个字节所能表示的有符号整数就可以达到20 多亿(注:231 = 2147483648,另外1位作为符号位),对于绝大多数情况都是可以处理的。
所以我们可以将一个对象的指针拆成两部分,一部分直接保存数据,另一部分作为特殊标记,表示这是一个特别的指针,不指向任何一个地址。所以,引入了 Tagged Pointer 对象之后,64位 CPU 下 NSNumber 的内存图变成了下面这样:
请添加图片描述
我们先看下下面这段代码:

dispatch_queue_t queue = dispatch_queue_create("queue", DISPATCH_QUEUE_CONCURRENT);
for (int i = 0; i < 1000; i ++) {dispatch_async(queue, ^{self.name = [NSString stringWithFormat:@"abcdefghijklmn"];});
}
NSLog(@"end");

运行结果:崩溃(坏内存访问)
请添加图片描述
原因分析:
因为setter方法中,对strong修饰的属性会有一个retainrelease的操作。在并发多线程的赋值操作中,都是对_name指针进行的操作,可能在_name刚刚被release后进行赋值操作,这个时候_name指向的内存地址是已经被释放了,所以造成了坏内存访问崩溃。

- (void)setName:(NSString *)name {[name retain];[_name relase];_name = name;
}

解决办法:

  1. 将并发执行的任务改为串行执行
dispatch_queue_t queue = dispatch_queue_create("queue", DISPATCH_QUEUE_SERIAL);
  1. 将异步执行改为同步执行
dispatch_sync(queue, ^{self.name = [NSString stringWithFormat:@"abcdefghijklmn"];
});
  1. 将属性改为atomic属性原子性
  2. 加锁
myClass *test = [[myClass alloc] init];
NSLock *lock = [[NSLock alloc] init];
dispatch_queue_t queue = dispatch_queue_create("queue", DISPATCH_QUEUE_CONCURRENT);
for (int i = 0; i < 1000; i ++) {dispatch_async(queue, ^{[lock lock];test.name = [NSString stringWithFormat:@"abcdefghijklmn"];[lock unlock];});
}
NSLog(@"end");

再看以下代码执行结果是什么,不崩溃了。因为没有用到引用计数的内存管理方法,使用的是Tagged Pointer

TaggedPointer 结构

苹果为了安全对其做了编码,runtime内部实现了编码、解码方法,我们看一下:
编码:

static inline void * _Nonnull
_objc_encodeTaggedPointer(uintptr_t ptr)
{uintptr_t value = (objc_debug_taggedpointer_obfuscator ^ ptr);
#if OBJC_SPLIT_TAGGED_POINTERSif ((value & _OBJC_TAG_NO_OBFUSCATION_MASK) == _OBJC_TAG_NO_OBFUSCATION_MASK)return (void *)ptr;uintptr_t basicTag = (value >> _OBJC_TAG_INDEX_SHIFT) & _OBJC_TAG_INDEX_MASK;uintptr_t permutedTag = _objc_basicTagToObfuscatedTag(basicTag);value &= ~(_OBJC_TAG_INDEX_MASK << _OBJC_TAG_INDEX_SHIFT);value |= permutedTag << _OBJC_TAG_INDEX_SHIFT;
#endifreturn (void *)value;
}

里面进行了一系列的位运算。
我们可以试着打印地址:

NSNumber *number1 = [NSNumber numberWithInt:1];
NSLog(@"number1 pointer is %p", number1);

输出:

number1 pointer is 0xbb027d74df7d32ea

可见,这个地址是被编码过的。通过资料的查询,我们可以对其结构有个了解:

  • Tagged Pointer 标记:x86最后一位是标记位,arm64最高位是标记位。1表示是Tagged Pointer对象,0表示是普通对象。
  • Tag:对象类型标记。x86为1~3位,arm64为0~2。7表示有扩展信息。
  • Extended:x86为4~11位,arm64为54~62。用来扩展更多类型。
  • payload:有效负载。存储真正的数据(除了标记位、tag以及extended),不过为了安全苹果做了编码。

payload 代表有效负载,源码中有这样的注释:
请添加图片描述
这里可以看出 需要经过 decoded_obj 加上一些位运算操作得到,说明是一个加密解密的过程,下面我们来看一下 decode

static inline uintptr_t
_objc_decodeTaggedPointer_noPermute(const void * _Nullable ptr)
{uintptr_t value = (uintptr_t)ptr;
#if OBJC_SPLIT_TAGGED_POINTERSif ((value & _OBJC_TAG_NO_OBFUSCATION_MASK) == _OBJC_TAG_NO_OBFUSCATION_MASK)return value;
#endifreturn value ^ objc_debug_taggedpointer_obfuscator;
}static inline uintptr_t
_objc_decodeTaggedPointer(const void * _Nullable ptr)
{uintptr_t value = _objc_decodeTaggedPointer_noPermute(ptr);
#if OBJC_SPLIT_TAGGED_POINTERSuintptr_t basicTag = (value >> _OBJC_TAG_INDEX_SHIFT) & _OBJC_TAG_INDEX_MASK;value &= ~(_OBJC_TAG_INDEX_MASK << _OBJC_TAG_INDEX_SHIFT);value |= _objc_obfuscatedTagToBasicTag(basicTag) << _OBJC_TAG_INDEX_SHIFT;
#endifreturn value;
}

它是由两个过程融合的。_objc_decodeTaggedPointer_noPermute()这个函数结束最后返回的 value 等于 value ^ objc_debug_taggedpointer_obfuscator,而 objc_debug_taggedpointer_obfuscator 代表混淆,在initializeTaggedPointerObfuscator()里可以看到它的初始化:

if (!DisableTaggedPointerObfuscation && dyld_program_sdk_at_least(dyld_fall_2018_os_versions)) {// Pull random data into the variable, then shift away all non-payload bits.arc4random_buf(&objc_debug_taggedpointer_obfuscator,sizeof(objc_debug_taggedpointer_obfuscator));objc_debug_taggedpointer_obfuscator &= ~_OBJC_TAG_MASK;#if OBJC_SPLIT_TAGGED_POINTERS// The obfuscator doesn't apply to any of the extended tag mask or the no-obfuscation bit.objc_debug_taggedpointer_obfuscator &= ~(_OBJC_TAG_EXT_MASK | _OBJC_TAG_NO_OBFUSCATION_MASK);// Shuffle the first seven entries of the tag permutator.int max = 7;for (int i = max - 1; i >= 0; i--) {int target = arc4random_uniform(i + 1);swap(objc_debug_tag60_permutations[i],objc_debug_tag60_permutations[target]);}
#endif
}

是赋随机值。
接下来我们去源码里看看tag的值和代表的类型:

{// 60-bit payloadsOBJC_TAG_NSAtom            = 0,OBJC_TAG_1                 = 1,OBJC_TAG_NSString          = 2,OBJC_TAG_NSNumber          = 3,OBJC_TAG_NSIndexPath       = 4,OBJC_TAG_NSManagedObjectID = 5,OBJC_TAG_NSDate            = 6,// 60-bit reservedOBJC_TAG_RESERVED_7        = 7,// 52-bit payloadsOBJC_TAG_Photos_1          = 8,OBJC_TAG_Photos_2          = 9,OBJC_TAG_Photos_3          = 10,OBJC_TAG_Photos_4          = 11,OBJC_TAG_XPC_1             = 12,OBJC_TAG_XPC_2             = 13,OBJC_TAG_XPC_3             = 14,OBJC_TAG_XPC_4             = 15,OBJC_TAG_NSColor           = 16,OBJC_TAG_UIColor           = 17,OBJC_TAG_CGColor           = 18,OBJC_TAG_NSIndexSet        = 19,OBJC_TAG_NSMethodSignature = 20,OBJC_TAG_UTTypeRecord      = 21,// When using the split tagged pointer representation// (OBJC_SPLIT_TAGGED_POINTERS), this is the first tag where// the tag and payload are unobfuscated. All tags from here to// OBJC_TAG_Last52BitPayload are unobfuscated. The shared cache// builder is able to construct these as long as the low bit is// not set (i.e. even-numbered tags).OBJC_TAG_FirstUnobfuscatedSplitTag = 136, // 128 + 8, first ext tag with high bit setOBJC_TAG_Constant_CFString = 136,OBJC_TAG_First60BitPayload = 0,OBJC_TAG_Last60BitPayload  = 6,OBJC_TAG_First52BitPayload = 8,OBJC_TAG_Last52BitPayload  = 263,OBJC_TAG_RESERVED_264      = 264
};

接下来,我们使用系统的方法解析一下地址,按照,看一下它们代表的真实含义吧:

int main(int argc, const char * argv[]) {@autoreleasepool {NSNumber *number0 = [NSNumber numberWithInt:0];NSNumber *number1 = [NSNumber numberWithInt:1];NSNumber *number2 = [NSNumber numberWithInt:2];NSNumber *number3 = [NSNumber numberWithInt:3];NSNumber *number4 = [NSNumber numberWithInt:4];NSNumber *number50 = [NSNumber numberWithInt:50];#pragma mark number1NSLog(@"number1 pointer is %p---PointerValue:==0x%lx", number1, _objc_getTaggedPointerValue((__bridge void *)(number1)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(number1)), _objc_getTaggedPointerTag((__bridge void *)(number1)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(number1))]));
#pragma mark number2NSLog(@"number2 pointer is %p---PointerValue:==0x%lx", number2, _objc_getTaggedPointerValue((__bridge void *)(number2)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(number2)), _objc_getTaggedPointerTag((__bridge void *)(number2)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(number2))]));
#pragma mark number3NSLog(@"number3 pointer is %p---PointerValue:==0x%lx", number3, _objc_getTaggedPointerValue((__bridge void *)(number3)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(number3)), _objc_getTaggedPointerTag((__bridge void *)(number3)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(number3))]));
#pragma mark number50NSLog(@"number50 pointer is %p---PointerValue:==0x%lx", number50, _objc_getTaggedPointerValue((__bridge void *)(number50)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(number50)), _objc_getTaggedPointerTag((__bridge void *)(number50)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(number50))]));NSString *str1 = [NSString stringWithFormat:@"a"];NSString *str2 = [NSString stringWithFormat:@"ab"];NSString *str3 = [NSString stringWithFormat:@"abc"];NSString *str4 = [NSString stringWithFormat:@"abcf"];
#pragma mark str1NSLog(@"str1 pointer is %p---PointerValue:==0x%lx", str1, _objc_getTaggedPointerValue((__bridge void *)(str1)));NSLog(@"    %@", binForObjectPointer(str1));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(str1)), _objc_getTaggedPointerTag((__bridge void *)(str1)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(str1))]));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%p", str1]));
#pragma mark str2NSLog(@"str2 pointer is %p---PointerValue:==0x%lx", str2, _objc_getTaggedPointerValue((__bridge void *)(str2)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(str2)), _objc_getTaggedPointerTag((__bridge void *)(str2)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(str2))]));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%p", str2]));
#pragma mark str3NSLog(@"str3 pointer is %p---PointerValue:==0x%lx", str3, _objc_getTaggedPointerValue((__bridge void *)(str3)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(str3)), _objc_getTaggedPointerTag((__bridge void *)(str3)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(str3))]));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%p", str3]));
#pragma mark str4NSLog(@"str4 pointer is %p---PointerValue:==0x%lx", str4, _objc_getTaggedPointerValue((__bridge void *)(str4)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(str4)), _objc_getTaggedPointerTag((__bridge void *)(str4)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(str4))]));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%p", str4]));
#pragma mark indexPathNSIndexPath *indexPath = [[NSIndexPath alloc] initWithIndex:4];NSLog(@"indexPath pointer is %p---PointerValue:==0x%lx", indexPath, _objc_getTaggedPointerValue((__bridge void *)(indexPath)));NSLog(@"    decode:==0x%lx tag:%hu", _objc_decodeTaggedPointer((__bridge void *)(indexPath)), _objc_getTaggedPointerTag((__bridge void *)(indexPath)));NSLog(@"    %@", getBinaryByHex([NSString stringWithFormat:@"%lx", _objc_decodeTaggedPointer((__bridge void *)(indexPath))]));}return 0;
}

输出:
请添加图片描述
请添加图片描述
可以看出,解析出来的tag就对应着它们的类型,看一下解析tag的方法:

static inline objc_tag_index_t
_objc_getTaggedPointerTag(const void * _Nullable ptr)
{// ASSERT(_objc_isTaggedPointer(ptr));uintptr_t value = _objc_decodeTaggedPointer(ptr);uintptr_t basicTag = (value >> _OBJC_TAG_INDEX_SHIFT) & _OBJC_TAG_INDEX_MASK;uintptr_t extTag =   (value >> _OBJC_TAG_EXT_INDEX_SHIFT) & _OBJC_TAG_EXT_INDEX_MASK;if (basicTag == _OBJC_TAG_INDEX_MASK) {return (objc_tag_index_t)(extTag + OBJC_TAG_First52BitPayload);} else {return (objc_tag_index_t)basicTag;}
}

解析出来的pointerValue就代表着他们的值:NSNumber类后一位前的十六进制代表它们的真实值;NSString最后一位代表字符串长度,后面每两位代表ASCII码值。
当8字节可以承载用于表示的数值时,系统就会以 Tagged Pointer 的方式生成指针,如果8字节承载不了时,则又用以前的方式来生成普通的指针。

特点

我们也可以看到苹果对于Tagged Pointer 特点的介绍:

  1. Tagged Pointer 专门用来存储小的对象,例如 NSNumberNSDate
  2. Tagged Pointer 指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象
    了,它只是一个披着对象“皮”的普通变量而己。所以,它的内存并不存储在堆中,也
    不需要 mallocfree
  3. 在内存读取上有着以前3倍的效率,创建时比以前快 106倍

因此,苹果引入 Tagged Pointer,不但减少了 64位机器下程序的内存占用,还提高了运行效率,完美地解决了小内存对象在存储和访问效率上的问题。

注意事项

isa指针

Tagged Pointer 的引入也带来了问题,即 Tagged Pointer 并不是真正的对象,而是一个伪对象,所以你如果完全把它当成对象来使用,可能会让它“露马脚”。在上一章中我们写道,所有对象都有isa 指针,而 Tagged Pointer 其实是没有的,因为它不是真正的对象。

64位下的isa指针优化

对于 64位设备,苹果除了引人 Tagged Pointer 来优化小的对象外,对于普通的对象,其isa指针也进行了优化和调整。在32 位环境下,对象的引用计数都保存在一个外部的表中,每一个对象的 Retain 操作,实际上包括如下 5个步骤:

  1. 获得全局的记录引用计数的hash 表。
  2. 为了线程安全,给该hash 表加锁。
  3. 查找到目标对象的引用计数值。
  4. 将该引用计数值加1,写回hash 表。
  5. 给该hash 表解锁。

从上面的步骤我们可以看出,为了保证线程安全,对引用计数的增减操作都要先锁定这个表,这从性能上看是非常差的。
而在 64 位环境下,isa 指针也是64 位,实际作为指针部分只用到的其中33位,剩余的 31位苹果使用了类似 Tagged Pointer 的概念,其中 19 位将保存对象的引1用计数,这样对引用计数的操作只需要修改这个指针即可。只有当引用计数超出19位,才会将引用计数保存到外部表,而这种情况是很少的,所以这样引用计数的更改效率会更高。
与前面的5个步骤对应,在64位环境下,新的 Retain 操作包括如下 5个步骤:

  1. 检查 isa 指针上面的标记位,看引1用计数是否保存在 isa变量中,如果不是,则使用以前
    的步骤,否则执行第2步
  2. 检查当前对象是否正在释放,如果是,则不做任何事情。
  3. 增加该对象的引用计数,但是并不马上写回到isa 变量中。
  4. 检杳增加后的引用计数的值是否能够被 19 位表示,如果不是,则切换成以前的办法,否
    则执行第5步。
  5. 进行一个原子的写操作,将isa 的值写回。

虽然步骤都是 5步,但是由于没有了全局的加锁操作,所以引用计数的更改更快了。

这篇关于[iOS开发]Tagged Pointer对象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/weixin_52192405/article/details/124914321
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/272833

相关文章

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

SpringBoot开发中十大常见陷阱深度解析与避坑指南

《SpringBoot开发中十大常见陷阱深度解析与避坑指南》在SpringBoot的开发过程中,即使是经验丰富的开发者也难免会遇到各种棘手的问题,本文将针对SpringBoot开发中十大常见的“坑... 目录引言一、配置总出错?是不是同时用了.properties和.yml?二、换个位置配置就失效?搞清楚加

Python中对FFmpeg封装开发库FFmpy详解

《Python中对FFmpeg封装开发库FFmpy详解》:本文主要介绍Python中对FFmpeg封装开发库FFmpy,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、FFmpy简介与安装1.1 FFmpy概述1.2 安装方法二、FFmpy核心类与方法2.1 FF

基于Python开发Windows屏幕控制工具

《基于Python开发Windows屏幕控制工具》在数字化办公时代,屏幕管理已成为提升工作效率和保护眼睛健康的重要环节,本文将分享一个基于Python和PySide6开发的Windows屏幕控制工具,... 目录概述功能亮点界面展示实现步骤详解1. 环境准备2. 亮度控制模块3. 息屏功能实现4. 息屏时间

SpringMVC高效获取JavaBean对象指南

《SpringMVC高效获取JavaBean对象指南》SpringMVC通过数据绑定自动将请求参数映射到JavaBean,支持表单、URL及JSON数据,需用@ModelAttribute、@Requ... 目录Spring MVC 获取 JavaBean 对象指南核心机制:数据绑定实现步骤1. 定义 Ja

Python打印对象所有属性和值的方法小结

《Python打印对象所有属性和值的方法小结》在Python开发过程中,调试代码时经常需要查看对象的当前状态,也就是对象的所有属性和对应的值,然而,Python并没有像PHP的print_r那样直接提... 目录python中打印对象所有属性和值的方法实现步骤1. 使用vars()和pprint()2. 使

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

使用Python开发一个现代化屏幕取色器

《使用Python开发一个现代化屏幕取色器》在UI设计、网页开发等场景中,颜色拾取是高频需求,:本文主要介绍如何使用Python开发一个现代化屏幕取色器,有需要的小伙伴可以参考一下... 目录一、项目概述二、核心功能解析2.1 实时颜色追踪2.2 智能颜色显示三、效果展示四、实现步骤详解4.1 环境配置4.

MySQL JSON 查询中的对象与数组技巧及查询示例

《MySQLJSON查询中的对象与数组技巧及查询示例》MySQL中JSON对象和JSON数组查询的详细介绍及带有WHERE条件的查询示例,本文给大家介绍的非常详细,mysqljson查询示例相关知... 目录jsON 对象查询1. JSON_CONTAINS2. JSON_EXTRACT3. JSON_TA

Python使用smtplib库开发一个邮件自动发送工具

《Python使用smtplib库开发一个邮件自动发送工具》在现代软件开发中,自动化邮件发送是一个非常实用的功能,无论是系统通知、营销邮件、还是日常工作报告,Python的smtplib库都能帮助我们... 目录代码实现与知识点解析1. 导入必要的库2. 配置邮件服务器参数3. 创建邮件发送类4. 实现邮件