微软资深软件工程师：阅读代码真的很难

时间：2014-09-22 11:43:13 阅读：285 评论：0 收藏：0 [点我收藏+]

编者按：原文作者EricLippert是一名资深软件设计工程师，从1996年起一直在微软开发部门任职，协助设计并实现VBScript、 JScript、JScript.NET、Windows Script Host、Visual Studio Tools for Office 和 C#。

bubuko.com,布布扣

Escalation的工程师JeremyK在他的博客中问到：

你是怎么教人们快速深入挖掘不熟悉的代码（不是自己所写的）？我学习如何编程的方法很传统 —— 自己动手编码。但我现在很纠结：到底是集中精神阅读源码，还是自己编写。对我而言，似乎唯一有效的方法就是自己写过。

不是和Jeremy开玩笑，写代码的确没有读代码难。

首先，我同意你的看法，几乎很少有人能读代码但不会写代码。这不像自然书面语或口语，理解他人的意思并不需要去理解他们为什么要那样说。比如，如果我说：

“写代码有两种方式：一种严格且详细，另一种模糊且草率。前者生成简洁分层的婚礼蛋糕，后者却是意大利面条。”

上面这句话产生一个平衡且幽默的效果，但即使听众和读者不理解我使用“零照应”和“并列句”这样的文字技巧，也会理解我要说的意思。但是说到代码，既要从代码本身中理解代码作者的意图，又要理解代码产生的预计效果，这两者都极为重要。

因此，我又回到那个问题了，有些人需要快速切入代码，但不需要动手写代码，那我们如何编写适合这些人的代码？

下面是我在编写代码时，尽力去做的事，目的就是使其他人能轻松阅读：

使代码遵从工具。Object Browsers和Intellisense虽然很好，但我告诉你，我是守旧派。如果找不到我想要的，我会不高兴。什么使得代码成为可查询的呢?
- 像"i"这样的变量名不好。如果没有明确的错误提示，你就无法轻易查找代码。
- 避免使用是其他名字前缀的名字。比如，在代码中有个“perfExecuteManifest”，如果再有一个“perfExecuteManifestInitialize”，这就会让我抓狂，因为每次在源码中查询前者时，我不得不费力地过滤掉后者所有的实例。
- “临时传递数据”（tramp data）应使用相同的名字。所谓“临时传递数据”（tramp data），就是指那些传递给方法A的变量，还要传给方法B的变量。这两类变量实际上是相同的，所以如果它们有着相同的名字，则更好。
- 别用宏来重命名东西。如果有个方法叫get_MousePosition，那别这样GETTER(MousePosition)来声明该方法。因为我会找不到实际的方法名。
- Shadowing会引起很多问题，请不要用它。

坚持使用一种命名模式。如果你打算用匈牙利命名法，那就坚持并广泛使用，否则将适得其反。使用匈牙利命名法来记录数据，而不是存储类型；记录普遍事实，而不是临时条件。

使用断言来记录先决条件（preconditions）和后置条件（postconditions）。

别缩写英文单词。确切来说，别缩写成稀奇古怪的形式。在脚本引擎中，有个变量名叫“NME”，这让我非常抓狂！它应当叫“VariableName”。

C语言标准运行时库的设计不是很优秀。别去效仿它。

别写“聪明”的代码；当代码出现问题，维护代码的程序员没时间去理解你的聪慧。

理解编程语言特性的设计初衷，使用这些特性去做它们适合完成的工作，而不是它们能做到的工作。例如：别把异常当做一般的流控制机制来使用（即便你能做到），而应该用它们来报告错误。别强制把接口指针转换成类指针，即便你知道这样没问题。

按功能单元划分源码树，而不是按组织结构。比如：我目前所在团队中，有2个根子目录的名字是“Frameworks”和 “Integration”，这是两个团队的名字。不巧的是，Frameworks团队名下有一个叫“Adaptor”的子目录，而“Adaptor”却是Integration的子目录，这就非常令人迷惑。同理，（如果）有着相同子目录的不同的子树，有些是客户端的组件，有些是服务端的组件；有些是管理组件，有些是非管理组件；有些是处理型组件，有些是非处理型组件；有些是零售组件，有些内部测试工具。这就会乱七八糟的。

当然，我实际上根本没有回答Jeremy的问题——如何调试不是我写的代码？

这取决于我的目的。如果我只是因为一个bug，而深挖一段具体的代码，我会在调试器中逐步跟踪所有代码，写下我“走过”的调用分支，记录下哪些方法是特定数据结构的“生产者”，哪些方法是“消费者”；我也会仔细盯着输出窗口，查看出现的有用信息；还要打开异常捕捉器，因为异常通常是问题所在。设置断点；我会记录所有和我上面建议相反的地方，因为这些东西很可能误导了我。

如果我想在理解一段代码后修改它，我通常是从代码头部开始，或者先查找公共方法。我要知道类是如何实现的，它是如何扩展的，它的作用，它是如何嵌入整个代码中的？我会尽力理解这些东西后，才去了解这些特定部分（代码）是如何实现的。这耗时虽更长些，但如果你准备改动复杂代码，你应当那样做。

如何阅读代码？像某些人一样……

我已经记不清有多少次看到程序员（用鼠标）滚上滚下地看着不熟悉的代码，几分钟过后，他们的脸上浮现出不悦的表情。他们不久后会宣告说，那代码不值一读，为什么要浪费时间呢？我们只能用其他方法解决问题。我不确定（他们）在期待什么，是通过潜移默化来吸收代码的含义，还是集中精神盯着代码来得到启发？你不能只靠长时间盯着代码来阅读代码，你要理解它并化为己用。这里有一些我喜欢用的技巧，虽然这不是一份详尽的列表，但我发现其中有些特别有用。

1. 尽力构建并运行代码。这通常是一个简单的步骤，就像你在看可运行的代码（这和随机代码相反）。不过，并非总是如此。通过构建和执行代码，你能从中学到很多上层代码结构。说到工作代码，你是否非常熟悉如何构建你的当前项目？虽然构建通常非常复杂，但通过构建并生成可执行的代码，你能学到很多。

2. 不要只注重细节。你要做的第一件事是，在你正阅读的代码中，找到代码结构和风格。首先浏览一下代码，尽力理解不同代码段要做什么。这会让你熟整个代码的上层结构，你也能领会到你正处理的代码的一些构思（良好架构和意大利面条等）。这时候，你可以找到切入点（不管它是什么，主函数、servlet 或控制器等），并查看代码如何在那里分支。不要在这上面花过多的时间，随着你愈加熟悉代码，你可以随时回来查看。

3. 确信自己理解所有结构。除非你碰巧是所用编程语言的首席专家，否则该语言有些它能做的事你可能还不知道。当你在浏览代码时，记下所有你或许不熟悉的结构。如果有很多不熟悉的结构，你要做的下一步非常明显。如果你不知道代码要做什么，那你就走不了很远。即便只有几个你不熟悉的结构，你应当深入查看。你现在是在探索你所用编程语言中你以前不知道的东西，为此花几个小时来阅读代码，我也非常乐意。

4. 既然你对大多数结构已有很好了解，那现在是该做些随机深入研究了。 就像步骤2，开始浏览代码，当这次要挑选一些随机函数或类，并开始逐行详细查看。这是硬仗开始的地方，但也是你要取得主要成功的地方。这里的构想，会形成你正在查看的代码库的思维模式。也不要在这上面花过长的时间，但在继续前行之前，你要尽力并极大吸收一些有内容的代码块。这个步骤，你也可以随时反复回过头来，每次你都会了解更多的背景，并收获更多。

5. 毫无疑问，在前面这些步骤中，肯定有你困惑的地方，所以这是你做些测试的最佳时间。在测试的时候，你的麻烦可能会更少，同时你也能理解代码。我一直感到奇怪，开发人员忽略一套写得很好很全面的测试代码，而尽力去阅读并理解某些代码。当然了，有时候并没有测试。

6. 如果你说没有测试，那这听起来是编写测试的时候了。 （编写测试）有很多益处，有助于你自己的理解，有助于你提升代码库，阅读代码时也能编写代码，这是该你出手做些事的时候。即便已经有了测试，通常你也可以编写一些测试，你总能受益的。测试代码通常需要换种方式思考问题，那些你以前不太明了的概念也会变得更清晰。

7. 提取奇特的代码，使其成为单独的程序。我发现阅读代码是个非常有趣的练习，即便只为节奏变化。即便你不了解代码的底层细节，你或许能知道一些代码在上层结构上要做什么。为什么不提取一些特定的函数，单独列为独立的程序。当你在执行小段程序时，调试也会更简单。反过来说，可能还需要一些额外的步骤，才能理解你正查看的代码。

8. 代码不干净？有异味？ 为什么不重构它？我并不建议你重写整个代码库，但重构部分代码，真的有助于你的理解层次上升一层。把你理解的函数拿出来，改成独立的函数。在你知道之前，原来的大函数看起来易管理，你可以在脑海中修改它。重构允许你把代码变成自己的，无需完成重写代码。如果有好的测试，有助于重构，但即便你没有好的测试，抽取你确定的函数并做测试。即便测试看起来完全不充分，但作为一个开发人员，你得学着相信你的技能，有时候你只需努力去做（重构）。（如果你必须重构，你通常都可以把代码恢复原状。）

9. 如果没什么能帮上忙，那你就找个阅读代码的同伴。或许并非只有你一个人能从这代码中获益，所以去找一个人，一起阅读代码吧。但你别找专家，他们会从上层结构上，向你解释所有东西，你会错失那些你自己详细查看代码时所能学到的细微差别。然而，如果不见效的话，你也不能理解，有时候，你能做的最好的事就是去问。向你的同事请教，如果你正在阅读开源代码，可以在互联网上找人问问。但是你要记住，这是最后一步，而不是第一步。

如果我时间紧迫，需要快速合理地理解某些代码，并且我只能挑选上述步骤的其中一个，那我会选择“重构”（即：第 8 个步骤）。虽然你能理解的东西不会很多，但那些你领会的东西，你会牢牢记住的。总之，有件事你需要记在心里。如果你新接触一个重要的代码库，你不可能立即能理解它。这需要数天、数周和数月的潜心努力，接受这个事实。即便有一位专家和你在一起，也不能明显地缩短时间。然而，当涉及到代码库时，如果你能耐心并有条不紊地阅读（和编写）代码，你最终能熟悉项目的方方面面，你能成为大牛。你或者是逃避阅读代码，经常寻求某人帮你讲解某事。我知道我会成为哪一种人。

寻找阅读代码的机遇 – 不要错失

我们喜欢编写新代码，是因为我们这次能正确处理问题。好吧，也许不是这次，但一定是下次。事实上是，你经常改进你的技术，但你从没有恰当地处理问题。这就是编写新代码的价值所在，你可以历练并磨练你的技能，但阅读和把玩其他人编写的代码，（如果没有更多的价值，）也是有同样多的价值。你不仅能从中获得一些有价值的技术知识，也能收获领域知识，领域知识通常仍具更多价值（毕竟，代码是文档的最终形式）。

即便代码写得很神秘，无任何惯例可言，但还是有价值。你知道我在说的代码，它几乎看起来晦涩难懂，但不是有意而为之（因某些原因，Perl 语言代码通常是这样的）。不管什么时候我看到那样的代码，我都会这样想：把它想象成只有你破译它后才能学到的东西。是的，这是主要的痛楚之处，但要接受它，有时候你自己也会因琐碎的原因而写出那种使人困惑的代码（否认没有用，你知道这是真的）。好了，如果你花些时间来阅读那样的代码，你更有可能最终写出同样的代码。并不说你将会写出那样的代码，但你有能力写出那样的代码。最后，态度通常是最重要的（编注：态度决定一切）。如果你视阅读代码为日常繁琐的工作，那它就是（繁琐的工作），并且你会逃避，但如果你视其为一个机遇，那好事终将到来。

注：本文转载自http://blog.csdn.net/sdulibh/article/details/38412955

微软资深软件工程师：阅读代码真的很难

原文：http://www.cnblogs.com/elisha-blogs/p/3985582.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)