高通吧
关注: 167,848 贴子: 3,840,197

  • 目录:
  • IT业
  • 256
    测试工具:Arm DS-5 Streamline performance analyzer 测试方法: 根据arm给出的公式计算: Bandwidth (Bytes) = (External Bus Read Beats + External Bus Write Beats) * Bus Width 其中External Bus Read Beats与 External Bus Write Beats由streamline读取GPU的L2cache对应数据获得(GPU也有L1与L2,其中L1由每个ALU独占,L2由一个EE中的所有ALU共享。arm给出的测量带宽方式就是读取L2cache的这两个数据)
    betakernel 1-23
  • 120
    转Anandtech: http://www.anandtech.com/show/10536/nvidia-maxwell-tile-rasteriz 渣翻译: 对于俺这种靠分析GPU来混饭吃的人来说,老黄的Maxwell架构是让我比较恼火的一个东西。28nm的Maxwell架构通过不多的核心面积增加,却获得了巨大的能耗比提升,使得老黄在工艺没有升级的情况下获得了一整代的性能提升。虽然以前也有过工艺不升级架构升级的情况,但从来没像Maxwell这次这么暴力过。 让我烦恼的是,NV对外分享了一些Maxwell架构相比Kepler架构效能提升的细节,但他们
    笋大喵 1-6
  • 261
    同频看,Kryo功耗还是比A72大很多的。。。 不过考虑同计算能力(仅限于Neon FP32 MADD),Kryo的功耗增加相比A72有限 能效比低是肯定的,但毕竟能Extend到更高的性能 当然,Perf/Power总体上没法跟A72比,不然那真是黑科技了。 另外:820 大雕,正常版,降档地雷。
  • 152
    补图。。。画了下
  • 146
    更新: 1. 修改CPU GPU双拷时,CPU负荷过高导致UI刷新慢,GPU的性能数值下降的问题 2. 增加温度显示。 3. GPU 和 CPU可以分开拷。如果都不选择,则为功耗和温度监控。 S810 双拷时,GPU依旧可以满载(实际降频到510MHz了,过热) Mate 8: 上一贴: http://tieba.baidu.com/p/4378882784 http://pan.baidu.com/s/1jHauCaM @b958755854
  • 251
    不好意思。。。这次更新比较多: 1. 烤鸡算法改了下。。傻傻的vadd和vmul忘记用vmla了 这次应该能把浮点性能榨干,发热也更感人,如下图 Mate8 飞行模式最低亮度待机0.5W,单核能烤到2.4W,双核3.8W,三核5.2W,四核6.8W 平均每个A72 1.6W -------------------- 2. 移除了Workload大小选择,现在没啥用 3. 暴力模式,大概20s刷新一次(普通模式约1.25s刷新一次),连着跑压力更大 4. 启动程序时不再读取电流信息,而是通过按钮“获取电流信息”点击后获取 避免一些机
  • 247
    今天看见有吧友说800锁单核心开应用速度比6589还要快 我就在想 到底是什么影响应用打开的速度?按pc上来说一般是io 那么我就做了一系列小测试。测试的应用是手机淘宝客户端 在断网的条件下打开 从按下到淘宝首页图片加载完毕的时间。过程就不截图了 直接上结果的图表。图表在寨板上做的 不太好看大家见谅
    削腚恶 3-28
  • 333
    Kirin 920是菊花海思最新发布的智能手机SOC嗯嗯,安兔兔跑分3W8,LTE Cat6基带 总之算是国产里非常牛逼的手机SOC了(具体信息请自行狗狗。。。) 我有幸去了6月6日芯片沟通交流会,获得了一个封了Kirin 920片子的纪念钥匙挂 (嗯嗯因为懒得在实验室拿相机了,以下都拿菊花P7拍个照凑活下) 那个,虽然很不舍得,但犹豫了半天,决定还是把它拆了:$ (以下情节比较暴力) 芯片本身封在有机玻璃里面,不太好处理,所以只能暴力下,拿锯子给锯了! 就是
  • 157
    为何在高通吧发帖: 7吧太水,这里学术类的探讨会更多一点,有兴趣了解R800i硬改过程的可以看我发帖记录。 首先,是R800i的硬改后的规格对比: CPU从MSM8255提升至体质更好的MSM8255AB,内存升至1GB LPDDR2 闪存的其余内容因为一些问题无法改动,后面的帖子会另做说明 那硬改到底有没有成功呢? 成功了,但是接下来,问题就来了
    百席账号 10-29
  • 180
    反正都写出来了,就拿出来大家一起分享,不是专业人士,所以神论是在所难免的,指出就好了,请不要吐槽
  • 115
    总之,游戏测试里,我还是比较失望的,没有想象中的那么好 这个672MHz的风扇满血GPU,我认为是打不过已经出来的高通S800的Adreno 330和将要出来的5420 Mali-T628 MP6的 游戏测试见: http://tieba.baidu.com/p/2567951631 首先介绍下架构: 简单看,T4的GPU在shader上,是Tegra3的6倍扩充,依旧采用分离的shader渲染架构 并且vertex shader和pixel shader数目保持在1:2 总的来说,就是6个VLIW4 (128bit) 顶点ALU,加上12个VLIW4(80bit)像素ALU单元 但是pixel shader部分的ALU组织采用了3-deep
  • 31
    前期知识请翻精华区 本次探讨的问题:为什么Adreno 305的单元比Adreno 225少,但表现却不比225差太多 唉,本来想写长点的 不过一些东西自己都还不太清楚 大概是这样: 大部分移动GPU的ALU都是vec4的SIMD,有些再带上个scalar单元 比如PowerVR SGX5XT的USSE2, 就是vec4 Adreno系列呢,跟AMD的R600系列差不多,VLIW的,但是不同于桌面的R600,Adreno 2xx的VLIW是把一个vec4的指令和一个scalar的指令打包起来,变成一个96bit的指令 相当于还是vec4+1 而桌面的R600,是VLIW5,可以把任
  • 13
    这次把A9的LLVM成绩补上了 A15的整数性能在高通神油下获得了11%的提升,A7也有5%的提升,但Krait 300提升只有1% 此外,通过高通神油,A15的内存性能提升了6%,而Krait 300损失了1%, A7更是下降了12% 不过浮点的话都损失了,Krait 300损失最多Orz 看来高通神油对A15比较有用啊 A7: MT6589 1.2GHz A9:K3V2 1.5GHz (不知道有么有偷偷降频啊) Krait 300: 8260A Pro 1.7GHz A15: Exynos 5250 1.7GHz 背景介绍: http://tieba.baidu.com/p/2402949725
  • 40
    就在Krait被御剑黑出翔的前几天,高通官方放出了针对Snapdragon Krait核心优化过的Android原生代码编译器,基于LLVM 3.2 高通官方宣称,部分情况下性能提升可以高达10%~ 在编译过程中,可以指定cpu类型为scorpion或者krait 指定为Krait时,会启用硬件除法器,并利用NEONv2和vfpv4的FMA指令 并对Krait的微架构进行优化,优化指令队列,最大程度的发挥Krait的性能 同时避免产生会让Krait损失性能的指令/队列 此编译器适用于各个版本的Krait 当然,指定Krait时会产生一些
    JauYungRwei 11-14
  • 79
    这个是ST的图,我把里面几个工厂的名字加上了……(本来是竞争对手啥的ST隐去了名字) 这么一看,各种工艺的定位就很清楚了…… ST的一些不太清楚, tsmc的话,最低端的28 LP不是HKMG的,是传统poly/Si的,也是现在高通,MTK6589采用的工艺 GF,Samsung的28nm全家都是HKMG的 另外GF跟Samsung好像有合作,所以GF也是有28LPH的. --------- 先说GF吧: SLP = Super Low Power ,移动设备用 HPP = High Performance Plus , 网络啊,那些插电的设备用,高性能,但是闲置耗电会多 LPH = Lo
  • 43
    x86跑Android:碰到ARM原生库,二进制转换(Binary Translation)的效率如何? ——个人向测试,仅供参考,机器是某想K800,Atom Z2460 1.6GHz 1C2T,系统官方4.04。 其实兼容性没得黑,armv7a的都能装都能跑,但是性能损失好像挺可观的……所以安兔兔跑3W又咋样,碰到native arm库是不是得打对折?
    板凳xl 5-8
  • 30
    移动GPU和桌面GPU之间并不存在本质的差异和架构的鸿沟——有的只是规模和频率上的差异。 实际上,具有相同资源的移动GPU,跟桌面GPU相比,同频率性能不会差到哪儿去。 现在的移动GPU,无论是ALU和TMU的数量和比例,还是API的支持程度,都在向桌面靠拢。新款的移动GPU跟几年前的入门桌面GPU,完全具有可比性。 ( 早期的桌面显卡,GMA系列,HD3200之流,基本都是20-40ALU, 2-4TMU 当前的中高端GPU,Adreno 320,543MP4等, 64ALU + 8TMU的也很常见 如果换算成同样
  • 41
    78吧友的一个问题,我顺带拿来在这里讲一下
  • 129
    首先,这个是给爱搞机(igao7.com)写的,分两集发,第一集在这儿 http://www.igao7.com/1217-vv-gpu.html 吧里的话 我先把全部放上来,吧里看看吧,因为爱搞机那边还没发全,所以请勿转载 (爱搞机已经发的没事) 一些内容之前已经涉及过了,这次是比较全的从头开始写一下 别插楼哈
  • 48
    一楼谢FPS meter root
  • 75
    喜欢在深夜发个帖~这样插得人比较少~~~ 主要是现在的人基本上都喜欢那“xxxp”来表示屏幕的分辨率~~~ 其实这是很不科学的~虽然我也偷懒这么用~~~ 但实际上“xxxp”代表的是progressive(逐行扫描)~~~ 而各个分辨率都有相应的名称~~~
    chasemoon6 6-28
  • 66
    第一波:http://tieba.baidu.com/p/1815909366 这里主要做一些更正: 伪科普向,不见得完全准确哦 为什么说shader计算能力重要呢……因为华丽丽的特效啥的都是靠的shader…… 移动设备屏幕就这么点打,三角形再多也多不到哪去……填充率么,随着内存带宽嗷嗷增加,嘛嘛也够用了,所以看三角形/填充率啥的已经out了! 移动设备的GPU,也到了拼shader能力的时代了! 这是GLbenchmark 2.5HD的1080p offscreen的得分情况 左边绿色的是我标的FP16的性能,单位GFLOPS(之前编
  • 132
    由于要自己想想怎么写,所以速度更新完毕是不可能的了,有空的随便看看吧。
  • 16
    好吧,水了那么长时间了,总得发一点东西,否则难免被人说是打嘴炮
    一直猜 2-22
  • 21
    (1)COMPRESSED_RGB8_ETC2:用于压缩RGB8数据,是旧纹理压缩格式OES_compressed_ETC1_RGB8_texture的超集(superset),可以向下兼容解码ETC1的纹理。包含了三个新的modes——利于尖锐的色度blocks的“T-mode”、“H-mode”以及利于平滑blocks的“Planar”。 (2)COMPRESSED_SRGB8_ETC2:同上,区别在于这个是按sRGB的值来编译。 (3)COMPRESSED_RGBA8_ETC2_EAC:编码RGBA8数据。RGB部分的编码方式和COMPRESSED_RGB8_ETC2相同。alpha部分则是独立编码。 (4)COMPRESSED_SRGB8_ALPHA8_ETC2_EAC:RGB值(不包括
  • 73
    其实我不知道应该从何说起。。。 因为我本身也不是业内人士,专业也不是这方面(俺专业化学),所以完全只能靠自己翻翻东西了解下,所以以下内容,不但不能保证完全正确,可能还有各种漏洞欠缺和错误,还请多多指正了。 先做几个基础铺垫: 1. GPU处理的东西 主要是顶点(vertex)和像素(pixel) 这两东西一般有四个属性: vertex: xyzw,就是坐标了~ pixel:rgba,就是颜色rgb加上透明度alpha通道 2. SIMD,Single Instruction Multiple Data,单指令多数据流 一条

  • 发贴红色标题
  • 显示红名
  • 签到六倍经验

赠送补签卡1张,获得[经验书购买权]

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!

本吧信息 查看详情>>

小吧:小吧主共18

会员: 沈总歌迷

目录: IT业

友情贴吧