#优化

4.4 CUDA prefix sum一步一步优化

前缀求和由一个二元操作符和一个输入向量组成,虽然名字叫求和,但操作符不一定是加法。先解释一下,以加法为例:第一行是输入,第二行是对应的输出。可以看到,Output[1]=Input[0]+Input[1],而Output[length-1]就是整个输入向量元素之和。为什么要使用并行计算?假如用串行计算来计算输出向量,那...

4.2 CUDA Reduction 一步一步优化

每个线程是基于一个树状的访问模型,从上至下,上一层读取数据相加得到下一层的数据.不停的迭代,直到访问完所有的数据.利用这么多的线程块(threadblock)我们需要做的事情如下:1. 处理非常大的数组2. 让GPU的每个处理器保持忙碌3. 每个threadblock迭代减少数组的区域. 比如这个图,第一次是8个数据,...
代码星球 代码星球·2021-02-24

3.3分析卷积乘法优化的复用

分析tile并行算法的优化情况:比如8个元素的一维卷积tile优化.M的大小是5,计算8个元素的卷积需要载入8+5-1=12,如果不使用tile,每个元素都需要载入8*5=40, 所以全局内存访问带宽减少40/12=3.3. 正常我们算40=8*5的方式来看,可以换另外一种方式来看,可以得到规律:可以看出来,...

OpenCL memory object 之 传输优化

转载自:http://www.cnblogs.com/mikewolf2002/archive/2011/12/18/2291741.html首先我们了解一些优化时候的术语及其定义: 1、deferredallocation(延迟分配),     在第一次使用...

从零开始入门 K8s | etcd 性能优化实践

本文整理自《CNCFxAlibaba云原生技术公开课》第17讲。/导读:etcd是容器云平台用于存储关键元信息的组件。阿里巴巴使用etcd已经有3年的历史,在今年双11过程中它又一次承担了关键角色,接受了双11大压力的检验。本文作者从etcd性能背景出发,带领我们了解了 etcdserver端性能优化及etc...

优化 Tengine HTTPS 握手时间

网络延迟是网络上的主要性能瓶颈之一。在最坏的情况下,客户端打开一个链接需要DNS查询(1个RTT),TCP握手(1个RTT),TLS握手(2个RTT),以及最后的HTTP请求和响应,可以看出客户端收到第一个HTTP响应的首字节需要5个RTT的时间,而首字节时间对web体验非常重要,可以体现在网站的首屏时间,直接影响用户...

使用split_size优化的ODPS SQL的场景

使用split_size优化的ODPSSQL的场景首先有两个大背景需要说明如下:说明1:split_size,设定一个map的最大数据输入量,单位M,默认256M。用户可以通过控制这个变量,从而达到对map端输入的控制。设置语句:setodps.sql.mapper.split.size=256。一般在调整这个设置时,...

数据库顶会VLDB论文解读:阿里数据库智能参数优化的创新与实践

一年一度的数据库领域顶级会议VLDB2019于美国当地时间8月26日-8月30日在洛杉矶召开。在本届大会上,阿里云数据库产品团队多篇论文入选ResearchTrack和IndustrialTrack。本文将对入围ResearchTrack的论文《iBTune:IndividualizedBufferTuningforL...

什么是最佳的视频用户体验?阿里云视频服务四大体验优化实践

5月29日,VEA中国视频体验联盟与VideoCTO联合主办“中国视频体验CTO论坛”在成都圆满落幕。该论坛旨在邀请视频产业生态链的经理人与技术专家,共同探讨视频体验评估标准,推动内容分发产业发展。阿里云受邀出席,技术专家陈石平现场进行了《云端一体化视频服务打造极致播放体验》主题演讲。 作为开发人员,需要关注...

etcd 在超大规模数据场景下的性能优化

/作者|阿里云智能事业部高级开发工程师陈星宇(宇慕)etcd是一个开源的分布式的kv存储系统,最近刚被cncf列为沙箱孵化项目。etcd的应用场景很广,很多地方都用到了它,例如kubernetes就用它作为集群内部存储元信息的账本。本篇文章首先介绍我们优化的背景,为什么我们要进行优化,之后介绍etcd内部存储系统的工作...

使用DataX同步MaxCompute数据到TableStore(原OTS)优化指南

概述现在越来越多的技术架构下会组合使用MaxCompute和TableStore,用MaxCompute作大数据分析,计算的结果会导出到TableStore提供在线访问。MaxCompute提供海量数据计算的能力,而TableStore提供海量数据高并发低延迟读写的能力。将 MaxCompute内数据导出至T...

04.SQLServer性能优化之---读写分离&数据同步

 /汇总篇:http://www.cnblogs.com/dunitian/p/4822808.html#tsql 换环境了,以后继续更...

06.SQLServer性能优化之---数据库级日记监控

/ 汇总篇:http://www.cnblogs.com/dunitian/p/4822808.html#tsql之前说了一下数据库怎么发邮件:http://www.cnblogs.com/dunitian/p/6022826.html不清楚的最好看一下,一会要用到。前言常规的性能监视有多种,对于我们这些不是...

03.SQLServer性能优化之---存储优化系列

/汇总篇:http://www.cnblogs.com/dunitian/p/4822808.html#tsql概 述:http://www.cnblogs.com/dunitian/p/6041323.html#com以下内容皆为个人摸索,没有人专门指导(公司不给力啊!DBA和大牛都木有。。。),所以难免出...

01.SQLServer性能优化之----强大的文件组----分盘存储

/汇总篇:http://www.cnblogs.com/dunitian/p/4822808.html#tsql文章内容皆自己的理解,如有不足之处欢迎指正~谢谢前天有学弟问逆天:“逆天,有没有一种方式可以让我一个表存到两个数据库文件中,或者说怎么把一个表的数据平摊到其他数据库文件中?”(⊙o⊙)…,逆天数据库优化不是很...
首页上一页12345...下一页尾页