高通吧-百度贴吧

256

贴吧用户_... 2019-02

测试工具：Arm DS-5 Streamline performance analyzer 测试方法：根据arm给出的公式计算： Bandwidth (Bytes) = (External Bus Read Beats + External Bus Write Beats) * Bus Width 其中External Bus Read Beats与 External Bus Write Beats由streamline读取GPU的L2cache对应数据获得（GPU也有L1与L2，其中L1由每个ALU独占，L2由一个EE中的所有ALU共享。arm给出的测量带宽方式就是读取L2cache的这两个数据）

betakernel 1-23

120

NVIDIA在Maxwell架构上使用了移动GPU常用的TBR渲染方式

ioncannon 2016-08

转Anandtech： http://www.anandtech.com/show/10536/nvidia-maxwell-tile-rasteriz 渣翻译：对于俺这种靠分析GPU来混饭吃的人来说，老黄的Maxwell架构是让我比较恼火的一个东西。28nm的Maxwell架构通过不多的核心面积增加，却获得了巨大的能耗比提升，使得老黄在工艺没有升级的情况下获得了一整代的性能提升。虽然以前也有过工艺不升级架构升级的情况，但从来没像Maxwell这次这么暴力过。让我烦恼的是，NV对外分享了一些Maxwell架构相比Kepler架构效能提升的细节，但他们

笋大喵 1-6

261

Kryo/A72工作曲线

ioncannon 2016-03

同频看，Kryo功耗还是比A72大很多的。。。不过考虑同计算能力（仅限于Neon FP32 MADD），Kryo的功耗增加相比A72有限能效比低是肯定的，但毕竟能Extend到更高的性能当然，Perf/Power总体上没法跟A72比，不然那真是黑科技了。另外：820 大雕，正常版，降档地雷。

共 4 张

风云magic 2-21

152

Cyclone，M1，Kryo和A57/A72

ioncannon 2016-03

补图。。。画了下

共 4 张

三粒句号 1-28

146

GPU GFLOPS 更新0.5版本！

ioncannon 2016-03

更新： 1. 修改CPU GPU双拷时，CPU负荷过高导致UI刷新慢，GPU的性能数值下降的问题 2. 增加温度显示。 3. GPU 和 CPU可以分开拷。如果都不选择，则为功耗和温度监控。 S810 双拷时，GPU依旧可以满载（实际降频到510MHz了，过热） Mate 8：上一贴： http://tieba.baidu.com/p/4378882784 http://pan.baidu.com/s/1jHauCaM @b958755854

丫吧满级 3-13

251

Neon烤机升级版：0.20版

ioncannon 2016-02

不好意思。。。这次更新比较多： 1. 烤鸡算法改了下。。傻傻的vadd和vmul忘记用vmla了这次应该能把浮点性能榨干，发热也更感人，如下图 Mate8 飞行模式最低亮度待机0.5W，单核能烤到2.4W，双核3.8W，三核5.2W，四核6.8W 平均每个A72 1.6W -------------------- 2. 移除了Workload大小选择，现在没啥用 3. 暴力模式，大概20s刷新一次（普通模式约1.25s刷新一次），连着跑压力更大 4. 启动程序时不再读取电流信息，而是通过按钮“获取电流信息”点击后获取避免一些机

共 4 张

阎阎阎杉 7-10

462

Anandtech的7420深入分析出来了，简单转一下

金毛评测犬

2015-06

RogerC

1-10

247

关于总线频率主频以及核心数对应用打开速度的影响的小测试

b958755854 2014-11

今天看见有吧友说800锁单核心开应用速度比6589还要快我就在想到底是什么影响应用打开的速度？按pc上来说一般是io 那么我就做了一系列小测试。测试的应用是手机淘宝客户端在断网的条件下打开从按下到淘宝首页图片加载完毕的时间。过程就不截图了直接上结果的图表。图表在寨板上做的不太好看大家见谅

削腚恶 3-28

333

菊花海思Kirin 920 拆解

ioncannon 2014-06

Kirin 920是菊花海思最新发布的智能手机SOC嗯嗯，安兔兔跑分3W8，LTE Cat6基带总之算是国产里非常牛逼的手机SOC了（具体信息请自行狗狗。。。）我有幸去了6月6日芯片沟通交流会，获得了一个封了Kirin 920片子的纪念钥匙挂（嗯嗯因为懒得在实验室拿相机了，以下都拿菊花P7拍个照凑活下）那个，虽然很不舍得，但犹豫了半天，决定还是把它拆了:$ (以下情节比较暴力）芯片本身封在有机玻璃里面，不太好处理，所以只能暴力下，拿锯子给锯了！就是

共 8 张

521521哈哈嘿 5-29

157

R800i硬改结果报告以及对后人的提醒

NEWADS 2014-06

为何在高通吧发帖： 7吧太水，这里学术类的探讨会更多一点，有兴趣了解R800i硬改过程的可以看我发帖记录。首先，是R800i的硬改后的规格对比： CPU从MSM8255提升至体质更好的MSM8255AB，内存升至1GB LPDDR2 闪存的其余内容因为一些问题无法改动，后面的帖子会另做说明那硬改到底有没有成功呢？成功了，但是接下来，问题就来了

百席账号 10-29

180

关于CPU的一些小了解

贴吧用户_... 2014-01

反正都写出来了，就拿出来大家一起分享，不是专业人士，所以神论是在所难免的，指出就好了，请不要吐槽

让我看看... 2-28

115

Tegra4 GPU分析测试——末代GeForce ULP给力否？

ioncannon 2014-02

总之，游戏测试里，我还是比较失望的，没有想象中的那么好这个672MHz的风扇满血GPU，我认为是打不过已经出来的高通S800的Adreno 330和将要出来的5420 Mali-T628 MP6的游戏测试见： http://tieba.baidu.com/p/2567951631 首先介绍下架构：简单看，T4的GPU在shader上，是Tegra3的6倍扩充，依旧采用分离的shader渲染架构并且vertex shader和pixel shader数目保持在1：2 总的来说，就是6个VLIW4 （128bit）顶点ALU，加上12个VLIW4（80bit）像素ALU单元但是pixel shader部分的ALU组织采用了3-deep

共 6 张

13924683340 6-14

31

谈谈shader的效率问题，以及新一代移动GPU所谓的scalar shader

ioncannon 2013-09

前期知识请翻精华区本次探讨的问题：为什么Adreno 305的单元比Adreno 225少，但表现却不比225差太多唉，本来想写长点的不过一些东西自己都还不太清楚大概是这样：大部分移动GPU的ALU都是vec4的SIMD，有些再带上个scalar单元比如PowerVR SGX5XT的USSE2，就是vec4 Adreno系列呢，跟AMD的R600系列差不多，VLIW的，但是不同于桌面的R600，Adreno 2xx的VLIW是把一个vec4的指令和一个scalar的指令打包起来，变成一个96bit的指令相当于还是vec4+1 而桌面的R600，是VLIW5，可以把任

叫我小狗... 9-17

13

高通LLVM编译器测试，更新A15和A9的LLVM成绩

ioncannon 2013-06

这次把A9的LLVM成绩补上了 A15的整数性能在高通神油下获得了11%的提升，A7也有5%的提升，但Krait 300提升只有1% 此外，通过高通神油，A15的内存性能提升了6%，而Krait 300损失了1%， A7更是下降了12% 不过浮点的话都损失了，Krait 300损失最多Orz 看来高通神油对A15比较有用啊 A7: MT6589 1.2GHz A9：K3V2 1.5GHz （不知道有么有偷偷降频啊） Krait 300： 8260A Pro 1.7GHz A15: Exynos 5250 1.7GHz 背景介绍： http://tieba.baidu.com/p/2402949725

共 5 张

贴吧用户_... 6-30

40

高通官方针对Krait优化的神油编译器测试

ioncannon 2013-11

就在Krait被御剑黑出翔的前几天，高通官方放出了针对Snapdragon Krait核心优化过的Android原生代码编译器，基于LLVM 3.2 高通官方宣称，部分情况下性能提升可以高达10%～在编译过程中，可以指定cpu类型为scorpion或者krait 指定为Krait时，会启用硬件除法器，并利用NEONv2和vfpv4的FMA指令并对Krait的微架构进行优化，优化指令队列，最大程度的发挥Krait的性能同时避免产生会让Krait损失性能的指令/队列此编译器适用于各个版本的Krait 当然，指定Krait时会产生一些

共 5 张

JauYungRwei 11-14

79

关于28nm工艺，简单整理下

ioncannon 2014-03

这个是ST的图，我把里面几个工厂的名字加上了……（本来是竞争对手啥的ST隐去了名字）这么一看，各种工艺的定位就很清楚了…… ST的一些不太清楚， tsmc的话，最低端的28 LP不是HKMG的，是传统poly/Si的，也是现在高通，MTK6589采用的工艺 GF，Samsung的28nm全家都是HKMG的另外GF跟Samsung好像有合作，所以GF也是有28LPH的. --------- 先说GF吧： SLP = Super Low Power ，移动设备用 HPP = High Performance Plus ，网络啊，那些插电的设备用，高性能，但是闲置耗电会多 LPH = Lo

共 5 张

咖啡再不... 8-30

43

x86跑Android：二进制转换效率测试

ioncannon 2013-05

x86跑Android：碰到ARM原生库，二进制转换(Binary Translation)的效率如何？ ——个人向测试，仅供参考，机器是某想K800，Atom Z2460 1.6GHz 1C2T，系统官方4.04。其实兼容性没得黑，armv7a的都能装都能跑，但是性能损失好像挺可观的……所以安兔兔跑3W又咋样，碰到native arm库是不是得打对折？

共 4 张

板凳xl 5-8

30

最后总结下我对移动GPU和桌面GPU的观点

ioncannon 2013-07

移动GPU和桌面GPU之间并不存在本质的差异和架构的鸿沟——有的只是规模和频率上的差异。实际上，具有相同资源的移动GPU，跟桌面GPU相比，同频率性能不会差到哪儿去。现在的移动GPU，无论是ALU和TMU的数量和比例，还是API的支持程度，都在向桌面靠拢。新款的移动GPU跟几年前的入门桌面GPU，完全具有可比性。（早期的桌面显卡，GMA系列，HD3200之流，基本都是20-40ALU， 2-4TMU 当前的中高端GPU，Adreno 320，543MP4等， 64ALU + 8TMU的也很常见如果换算成同样

天堂鸟之家 6-3

41

既然都支持ETC1，那么为什么VIVANTE的gpu会出问题啊。。。

ioncannon 2013-07

78吧友的一个问题，我顺带拿来在这里讲一下

腹黑萝莉兔 7-27

129

关于移动GPU，总结下

ioncannon 2014-01

首先，这个是给爱搞机（igao7.com）写的，分两集发，第一集在这儿 http://www.igao7.com/1217-vv-gpu.html 吧里的话我先把全部放上来，吧里看看吧，因为爱搞机那边还没发全，所以请勿转载（爱搞机已经发的没事）一些内容之前已经涉及过了，这次是比较全的从头开始写一下别插楼哈

忧郁的理... 10-27

48

说好的Adreno220 VS SGX540

御剑检察官 2013-06

一楼谢FPS meter root

15296840696 6-22

75

【科普贴】关于显示分辨率的那点事~以及1080i和1080p的区别~~~

鸡大大1 2013-07

喜欢在深夜发个帖~这样插得人比较少~~~ 主要是现在的人基本上都喜欢那“xxxp”来表示屏幕的分辨率~~~ 其实这是很不科学的~虽然我也偷懒这么用~~~ 但实际上“xxxp”代表的是progressive（逐行扫描）~~~ 而各个分辨率都有相应的名称~~~

chasemoon6 6-28

66

【伪科普贴第二波】主流GPU的一些shader计算能力比较

ioncannon 2014-01

第一波：http://tieba.baidu.com/p/1815909366 这里主要做一些更正：伪科普向，不见得完全准确哦为什么说shader计算能力重要呢……因为华丽丽的特效啥的都是靠的shader…… 移动设备屏幕就这么点打，三角形再多也多不到哪去……填充率么，随着内存带宽嗷嗷增加，嘛嘛也够用了，所以看三角形/填充率啥的已经out了！移动设备的GPU，也到了拼shader能力的时代了！这是GLbenchmark 2.5HD的1080p offscreen的得分情况左边绿色的是我标的FP16的性能，单位GFLOPS（之前编

小白正是... 6-11

132

从linux到android

大

冲了... 2013-08

由于要自己想想怎么写，所以速度更新完毕是不可能的了，有空的随便看看吧。

阿v斯大林 8-14

16

【翻译】Apple vs.Samsung

贴吧用户_... 2013-02

好吧，水了那么长时间了，总得发一点东西，否则难免被人说是打嘴炮

一直猜 2-22

21

纹理压缩格式ETC2/EAC的一些翻译

天空渐晴 2013-06

（1）COMPRESSED_RGB8_ETC2：用于压缩RGB8数据，是旧纹理压缩格式OES_compressed_ETC1_RGB8_texture的超集（superset），可以向下兼容解码ETC1的纹理。包含了三个新的modes——利于尖锐的色度blocks的“T-mode”、“H-mode”以及利于平滑blocks的“Planar”。（2）COMPRESSED_SRGB8_ETC2：同上，区别在于这个是按sRGB的值来编译。（3）COMPRESSED_RGBA8_ETC2_EAC：编码RGBA8数据。RGB部分的编码方式和COMPRESSED_RGB8_ETC2相同。alpha部分则是独立编码。（4）COMPRESSED_SRGB8_ALPHA8_ETC2_EAC：RGB值（不包括

降龙棍法 7-7

73

关于移动GPU的一些说明（肤浅简介，伪科普向）

ioncannon 2013-09

其实我不知道应该从何说起。。。因为我本身也不是业内人士，专业也不是这方面（俺专业化学），所以完全只能靠自己翻翻东西了解下，所以以下内容，不但不能保证完全正确，可能还有各种漏洞欠缺和错误，还请多多指正了。先做几个基础铺垫： 1. GPU处理的东西主要是顶点（vertex)和像素（pixel）这两东西一般有四个属性： vertex: xyzw,就是坐标了～ pixel：rgba，就是颜色rgb加上透明度alpha通道 2. SIMD，Single Instruction Multiple Data，单指令多数据流一条

亚丁湾外... 11-9

扫二维码下载贴吧客户端

本吧信息查看详情>>

自定义链接

友情贴吧

日	一	二	三	四	五	六

扫二维码下载贴吧客户端

本吧信息 查看详情>>

自定义链接

友情贴吧

本吧信息查看详情>>