d=k+1,n=2k,α=2,β=1 Exact Regenerating Code with uncoded repair— CME

文章bibtex

@article{陈勇2012基于组合矩阵的精确修复, title={基于组合矩阵的精确修复 MDS 编码< br/>}, author={陈勇 and 武国强 and 林宝军}, journal={宇航学报}, volume={33}, number={11}, pages={1654--1659}, year={2012} }

文章提出了d=k+1, n=2k, α=2, β=1 精确修复的再生码CME(Compound-Matrix Encoding),CME 是系统码,每个节点都保存了1/n 的原始数据,存放模式如下图,一半原始数据,一半冗余数据。文章在域GF(2) 下给出了详细的构造、修复方法。

20

继续阅读

最近收到推送的文章

这两个月收到不少scholar 推送的文章,有十几篇,抽空看看了。

1  Tree-Structured Parallel Regeneration for Multiple Data Losses in Distributed Storage Systems Based on Erasure Codes(基于纠删码的分布式存储系统中针对多数据失效的树型并行修复技术)

针对多块数据丢失再生冗余数据块进行了讨论,主要是优化速度,通过并行加速修复过程。提出了一种树型修复方式

2  An Improved Sub-Packetization Bound for Minimum Storage Regenerating Codes

文章讨论了MSR的系统码(systematic code)中B(文中用sub-packetization l表示)和k 和r=n-k 的关系。(n, k)-MSR系统码要求k不能太大,否则无法修复。文中虽然没有给出k 具体的上限,但给定了一个上限

3  Symmetry in Distributed Storage Systems

文章提出一种可以达到任意码率的精确修复的(n,k,d,,α,β)再生码方案:concatenation scheme

4  Impact of Stripe Unit Size on Performance and Endurance of SSD-Based RAID Arrays

文章讨论了SSD 中RAID 分片大小,4KB 条带更适合SSD RAID

5  RAIDq: A software-friendly, multiple-parity RAID

文章基于plank 和HP anvin 的文章提出了编解码速度非常快的RAIDq ,可以详细看看

6  Rateless codes and random walks for P2P resource discovery in grids

在P2P 存储系统中使用rateless codes 实现网络编码,较少资源更新时的网络开销

7  Efficient Encoding Schedules for XOR-based Erasure Codes

之前会议的文章的republish

8  Erasure coding for cloud storage systems: A survey

从MDS 到Regenerating codes 的survey,入门survey,讲的也不是很全,但普及了概念

9  Enabling Data Integrity Protection in Regenerating-Coding-Based Cloud Storage: Theory and Implementation (Supplementary File)

香港科技大学网络编码实验的一片关于NCCloud 和FMSR 的补充说明:加密和存储开销等

10  基于组合矩阵的精确修复MDS 编码

精确修复和GF(2) 是亮点,希望这篇不会让我失望

Screaming Fast Galois Field Arithmetic Using Intel SIMD Instructions(FAST 13′)

PDF     Slide     Video

这是FAST13 中一篇关于通过Intel SSE3 指令集加速伽罗瓦域上计算的短文。纠错码广泛用于存储系统中,可分为XOR(异或)码和Reed-solomon(RS) 码。前者(LDPC, RAID5, X-code)在编码时仅进行异或运算,速度快;后者编码运算基于伽罗瓦域/有限域GF(2w),速度相对较慢(XOR 可看做是GF(2) 上的运算)。该文旨在提出基于处理器128 比特指令集加速编码时的乘法运算。

继续阅读

系统论文的结构

源地址:http://www.cs.ucr.edu/~michalis/TECHWRITING/structure.html

一些原则:

  1. 递归性:section 的第一段应该是该section 的一个总结(summary/overview)。你可以这样开始“In this section, we present …”。
  2. 递归性:在每段中,第一句(或者第二句)应该是该段的总结(summary)。
  3. 自顶向下:从最顶层缓慢介绍细节。
  4. 让读者有准备:论文不是悬疑惊悚片,读者应该有个大概思路你要往那走。
  5. 适应性:这些原则起指导作用。但不同的文章有不同的要求。当你破坏了一些原则的时候,你应该意识到这点,并具有充分的理由。
  6. 忌讳:庞大的引言:如果你的引言超过了1.5 页纸,那么你可能思路还不清晰,或者你的摘要有问题。
  7. 注意:你可以破坏所有的原则,但你也会为之付出代价的。

继续阅读

如何写篇好的系统文章[译]

原文How (and How Not) to Write a Good Systems Paper

写在之前:本文最早出现在ACM SIGOPS Operating Systems Review, Vol. 17, No. 3 (July, 1983), pages 35-40. 作为USENIX 推荐的写作指南对刚动手写论文的写手应该有好的借鉴作用。

一、引言

1983 年 3月 21日,第九届操作系统原理研讨会(SOSP)收到83 篇论文,经过阅读后收录了其中的16 篇作为会议论文发表。录用比率约为1/5 ,虽然收到的论文数量较前几年少,但和往年的会议录用率相近。会议委员会许多成员都发现非常容易分开好的文章和差的文章;的确,十个委员对80% 的论文的处理很快就做出了决定。考虑到接受率,其中大部分文章都被拒绝了。

在进行完会议论文的筛选工作,一些委员表现了对提交论文整体质量的失望。许多被拒的文章表现出类似的弱点,会议委员们认为这些弱点对于作者应该是显而易见的。抱着提高之后SOSP 会议提交文稿、以及更普遍的系统论文的质量,程序委员会决定对收到的论文采用一个标准进行评估。本文将结合委员会所有成员所使用的标准,而不只是作者的。

为了避免冠冕堂皇的说教,我们使用一种启发性、偶尔幽默的方式,以第一、第二人称来陈述。但是,文章的目的却是很严肃的:指出科技论文中不断重复的常见问题,以帮助以后写手们(作者)不再范同样的问题。当你阅读这篇文章的时候,假设你将为第十届SOSP 会议或者TOCS 会议投稿。你在发表之前已经做了一些工作,所以你坐下来开始写一篇文章。当你写的时候你应该问自己哪些问题呢?而这些也是我们检查你的论文将提出的,并决定你的论文是否被发表的问题。

继续阅读

NCCloud: Applying Network Coding for the Storage Repair in a Cloud-of-Clouds

该文出现在FAST12 会议上,介绍了在多个云存储服务提供商之上,利用随机网络编码(RNC)搭建一个可靠存储系统,实现了功能性最小存储再生码(F-MSR)来减少修复数据的带宽。

优点:提供了一种实现MSR 的简单方法。

问题:在已经非常可靠的云存储之上做编码是否得不偿失,而且文中实现的(4,2) 编码实用性有待讨论。

继续阅读