撰写报告就像是任何其他的技能一样,要通过学习具体的流程和不断练习才能提升。这篇文章详实地阐述了一个数据报告“苦手”如何“上手”修炼这门技能。
01 明确内容
在每次的数据分析工作中,将分析过程与结果写成一份通俗易懂的报告是工作的最后一步,并且对有的人来说,这也是最难的一步。一份技术报告的目的是传递信息。然而,技术信息是很难让人理解的,因为它不仅复杂,而且无法让人轻易的了解。将数学焦虑等融入到任何事情都可以被统计数据证实这一流行观念中,你就可以明白为什么做数据分析报告是一份挑战。
一个人撰写有效的数据分析报告的能力不应该被假定。它和为课堂作业写一份只有指导员才去看的课题报告不是一回事。并且数据分析员只接受过少量的或者没有接受过这类技术写作格式的培训是一个普遍的现象。一些数据分析员从来没做过这样的工作,并且他们害怕这个工作过程;一些数据分析员没怎么做过这样的工作,并且他们认为每份报告差不多都一样;一些数据分析员在不同的情况下学过怎么写报告,比方说写公司的通讯稿,并且他们认为自己了解所有需要了解的东西;还有最坏的情况是,有的数据分析员在没有指导的情况下写了分析报告,养成了坏习惯,并且自己还不知道。
十分肯定的是,如果你还没有上过与撰写数据分析报告相关的大学课程或者职业发展课程,没有在工作中接受过相关的指导,并且也没有做过独立的相关性阅读,那么,你需要学习一些关于撰写技术报告的知识。撰写报告就像是任何其他的技能一样,要通过学习具体的流程和不断练习才能提升。下面是四件你可以尝试用来提高你的技能的事情。
-
自主学习。了解其他人对技术写作的认识。浏览与“统计分析报告”和“技术写作”有关的网站,这种网站有数以百万个。学习网络课程或者线下课程。阅读相关书籍或指导手册。通过雅虎,谷歌或者领英加入到相关的网络小组中去。将你自己沉浸在这个话题中,就像你在学校里做过的那样。
-
了解批评。在你的职业生涯中,你将给出或者收到很多关于技术报告的批评。并不是所有的批评都具有相同的价值。首先,你需要考虑是谁在批评。有的评论家从来没有写过数据分析报告,甚至有的从来没有分析过数据。但是,如果这个批评家是那个付账单的人,那你还是想办法受着吧。如果是你给出批评的话,你需要学习如何给出有建设性的批评。要尊重报告写作者对写作结构和形式的判断,除非这份报告实在是太糟糕了。关注内容。做个友善的人。
-
下载案例。在网上寻找关于数据分析报告的例子(提示:搜索的时候加上“pdf”和“下载”可能会有帮助)。评论这些例子。这些报告的受众是谁?传递的信息是什么?每份报告的优缺点有哪些?哪些报告你觉得属于好的例子?他们做的哪些工作是你在将来工作时可能会想去做的?
-
找到适合你的。当你在网上查找与技术写作相关的建议或者学习知识渊博的指导员开设的课程时,你将会听到一些不同的观点。每个人都会提到受众和内容,但是大部分人在报告结构、写作风格及如何进行写作方面的观点都很有局限性。如果专家让你做的事情感觉不对的话,那就忽略它。只要确定你最终选择的方法适合你自己以及将会读到你的报告的受众就好了。
如果上面的四点你都做了,那么接下来就仅仅是练习的问题了。你会从你撰写的每份报告里学到一些东西。如果你对数据分析报告撰写流程很陌生的话,那么可以考虑学习下面的六个课程。
第一课——明确内容
第二课——了解读者
第三课——明确方法
第四课——吸引注意力
第五课——完成
第六课——得到认可
第一课—明确内容
从你最了解的部分着手开始。在写一份数据分析报告时,你最了解的部分应该是你分析的统计数据、绘制的图形以及建立的模型。
你应该有能力去描述你是如何呈现总体特征的,如何生成这些数据的或者是提供了这些数据的源头,在做探索性的分析时你发现了数据存在哪些问题,你是如何处理这些数据的,对异常数据你做了怎样的处理,应用了怎样的变换方法,对于缺失的和重复的数据你做了什么,你是如何处理违反假设的情况和不显著的结果的。
接下来,你需要决定什么是重要的内容,以及,哪些内容对报告阅读者来说是重要的。因为除非你写的报告是面向你的大学教授或者是同龄的数据分析专业人员,否则的话,你可以十分确定的认为没有人想听你讲你是如何解决各类问题的,你用了什么技巧,或者你在分析数据的时候多么努力。没有人在意你的结果是来自Excel表格还是一段自己用R语言编写的程序。
一旦整理出了你需要的信息,就为这份报告写一个概述,这样你就会知道你都要写些什么内容。这样做可以帮助你不偏离主线。你的总结或许可以选择以下三种形式中的一种:
-
执行总结。执行总结面对的是决策者或者那些没有足够的时间或耐心去阅读超过400字的文章的人。把你的概述缩减到一页以内,不要使用任何术语,只提供那些决策者需要的,可以帮助他采取适当行动的结果信息(也就是:你想要传达的信息)。
-
总括。总括面对的是大部分读者,无论他们是否会阅读这份报告。一篇总括是报告内容的删减版,并且关注点在你想要传达的信息上。总括的内容也不应超过几页纸。
-
摘要。摘要面对的是同专业的人以及其他可以看懂数据分析的人。一篇摘要的内容通常是一页纸或者少于一页纸,并且总结了你所做的所有的重要的工作,从定义总体到评估效应量。摘要通常被用在学术论文写作中。
一旦你知道了你的读者是谁,你就可以重新撰写概述以便抓住读者的注意力。
02 了解读者
每篇教你自学技术写作的文章都会首先告诉读者要考虑他们撰写报告的观众。即使如此,或许很少有作者真的这样去做。
在统计分析中,你通常会先开始考虑你想要做出推断的那些总体所具有的特征。与之相似的,当你开始撰写一篇分析报告时,你通常会先开始考虑你想要进行交流的那些读者所具有的特征。你必须考虑那些即将阅读你的报告的读者的这些特征:是谁(who)、是什么(what)、为什么(why)、在哪里(where)、什么时间(when),以及如何做(how)。这里有一些你需要考虑的和读者有关的内容。
是谁
读者通常是通过他针对报告所扮演的角色来定义的。一些读者会用这份报告来做决策。一些读者会通过这份报告学习新的信息。其他的会根据自己已经知道的情况来评论这份报告。因此,一份统计报告的读者通常会被定义为:决策人员、股东(利益相关者)、评论家或者对报告感兴趣的个人。
有的报告只会被一个人阅读,但是大部份报告会有很多读者。各行各业的人都有可能阅读你的报告。因此,会有初级的、中级的、甚至更多不同级别的读者参与阅读。这是有问题的,因为你无法取悦每个人。因此,要通过定位你的读者,首先关注接收你的信息的最重要的读者,其次关注读者中群体最大的那一部分。
是什么
一旦知道你的报告的目标受众是哪些人,你就应当尝试弄明白他们的特征。或许对于一个技术报告作者来说,最重要的特征是读者对报告的主题和报告中描述的统计技术的了解程度。你可能没办法改变读者对报告主题的知识储备,但是你可以通过调整呈现统计信息的方式帮助读者理解内容。例如,一个数据分析师可能遇到的读者类型包括:
-
数学恐惧者。惧怕数字但是或许愿意了解概念。不要使用任何统计学术语。不要呈现公式。尽可能少的使用数字。例如,用“大约一半”代替任何百分比在50%左右的数字。那些额外的精度对数学恐惧者来说并不重要。
-
过路人。懂一些知识但是不怎么感兴趣。不要担心路过者,他们不会看超过摘要以外的内容。要确保摘要简明扼要并且突出最重要的发现,否则的话,他们可能会聚焦在相对不重要的内容上。
-
游客。懂一些知识并且有兴趣。稳当一点。只是用你定义明确的基本术语。可以使用数字,只不过在一张表格里不要用得太多。将数值化为证书以保证你没有暗示错误的精确度。坚持使用饼图、柱状图,或许偶尔使用一下散点图,不要使用比这些更复杂的工具。不要使用任何公式。
-
卖弄者。懂得比自己认为的少并且想要展示。只要你把你表达的意思定义出来,就可以使用术语。甚至一个喜欢卖弄的人也可能学到些东西。同样的,使用数字、统计图表,以及公式也是可以的,只要你能清晰的解释它们的含义。这类人如果没有指导的话可能会得出不正确的结论。
-
非专业人员。其他的可以理解基本术语的分析员。你写什么都可以,只要能够清晰的表达你的观点。
-
同行。其他的可以理解所有术语的分析员。你怎么写都行。
读者的特征为报告的长度、撰写的语调和风格提供了指导。
为什么
那些读者很可能是对你的报告非常感兴趣呢还是仅仅是对它感到好奇(如果他们没有兴趣,那么他们就不算是读者)?对自己坦诚一点。为什么别人要有兴趣阅读你的报告呢?你将谁定义成为你的目标读者呢?他们会用你的发现做些什么呢?他们会了解到有用信息吗?他们将会做出一个决策呢还是会采取一个行动呢?这对他们来说是一个很重要的东西呢还是他们必须关注的?
在哪里
这份报告的受众是一个数量、范围有限的群体呢,例如为一个组织而进行的分析,还是任何人都有可能阅读它呢?这份报告的目标是组织中的上层人员呢还是普通人员(也就是说是自下而上还是自上而下)?关于这份报告有没有安全性或保密性的顾虑呢,无论是在个体还是组织层面上?
什么时间
读者什么时候需要看到你的报告?在公布报告以前谁必须复查这份报告以及复查需要多久?截稿日期是否无法变动?你还剩多久的时间来撰写这份报告?是否有足够的时间让你想清楚你需要写什么?是不是有时间让你进行必要的额外的分析以填补报告大纲中的空白?当复查你的报告的时间是你撰写它所花费的时间的两倍的时候,你是否会因此生气呢?
这里有一些你应当牢记于心的建议。绝对,绝对,绝对不要将你没有写完、没有编辑好的报告的草稿提交上去应付复查。我告诉自己我写的每份报告都要遵守这条规则。不幸的是,想大多数人一样,我不听自己说的话。
如何做
最后,你要考虑如何呈现这份报告才能使读者从中或许到最多的信息。这里有五条需要你考虑的。
组装。你写的报告将被如何组装起来(也就是说:组装成一件可以被分销的产品)?它将是一个简短的书信式报告,一份综合报告,一篇博客或者是一篇网络文章,一篇专业的期刊文章,一份权威报告,还是你的报告会构成其他文件的组成部分呢?
形式。你的这份报告将以电子文件的形式还是纸质文件的形式被分发呢?如果它是以电子形式被分发的话,它能否在互联网上取得呢?它能否被编辑呢?它是否会以什么形式限制获取呢,例如密码?
外观。这份报告是只能以白纸黑字的形式来呈现呢还是可以使用彩色内容?图表与文字的比重是多少?这份报告是很传统的呢还是会很华丽,就像营销手册一样?报告里会有11×17英寸大的折叠页呢还是会有超大的像地图一样的插入页呢?
特殊项目。除了报告以外你是否还需要提供其他东西呢?例如数据的电子文件,分析脚本或者程序代码,以及输出结果。你是否需要根据报告内容创建一份演示文稿呢?你的图表是否会被用在法庭上或者被用在公开展示中?
易使用性。你是否需要遵循1973年《复兴法案》中的第508条准则?这可能会影响你在标题、表格、图表以及特殊字符上的使用。在你的图表中,你是否应该考虑常见的色盲形式?
花一些时间
在评估你的读者的时候,你没必要把以上所有的细节都阐述一遍,并且,许多细节只需要片刻的思考就可以了。但是,如果你把这些点都考虑过一遍以后,你会更好的理解你是为谁写这份报告的以及你应当如何撰写它。
03 明确方法
从高中起你就被告知行文开始前要拟一个大纲,写分析报告也是这样。然而有许多可能的提纲你可以根据您的受众特点和期望来选择。你首先要决定的是报告最终的建议是什么。
您的报告是像政府部门的行政简报(不要混淆法律简报),信函报告,总结报告,综合报告,互联网文章或博客,专业期刊文章或白皮书等等。每一种报告都有自己的受众类型,内容和风格。以下是他们的差异的总结。
写报告就像是去旅行。信息就是你想要传递给最终目的地——观众的资产。报告的建议是持有信息的车辆。现在,您需要一张地图来了解如何到达目的地——那就是提供。
就像地图上有不只一条可能的路线,这里也有几种可能的大纲策略可以用来编写报告。以下提供六个。
-
“不置可否”的方法。这是没有经验的报告作者在没有指导时所做的。他们像大学里可能做过的那样,或者在他们走的时候把事情做好。这可能会工作得很好,或者像父亲节的“毛利秀”一样令人困惑。考虑到这个报告涉及统计数据,你可以猜出它是哪一种类型。
-
历史的方法。这是没有经验的报告作者使用的另一种方法。他们重复上次做类似报告时所做的事情。这也可能工作得很好。但最后的报告可能是失败的,无法传达其信息。
-
“标准”方法。有的公司或组织对他们的所有报告都有一套标准的准则,甚至要求在报告发布之前先经过正式的审查。许多学术和专业期刊使用这种规定性的方法。结果可能好也可能不会很好,但至少看起来像其他报告。
-
军事方法。你告诉他们你要告诉他们什么,然后告诉他们,然后再告诉他们你已经告诉他们什么了。军事方式可能是冗余而无聊,但有些职业靠它而生。如果你有一个可能会丢失细节的重要信息,这种方法效果很好。
-
跟随数据的方法。如果您具有非常结构化的数据分析,则可以按顺序报告每个数据片段。调查往往属于这一类。这种方法使编写报告变得容易,因为在按照原始顺序重新组合之前,可以将报告各个部分分开并分发给其他人写。缺点是这种方法通常没有给出综合的结果。读者只能自己思考这一切意味着什么。
-
讲故事的方法。这种方法认为阅读统计报告不应该像修剪草坪一样枯燥。相反,你应该引导读者的好奇心,就像解开神秘的谋杀案之谜,你一点点地提供线索,但当把所有的线索放在一起时你给出的结论又十分合理。这与上述的“跟随数据的方法”几乎相反。在讲故事的方法中,报告从最简单的数据分析开始,逐渐地过渡到精彩的高潮 - 分析的结论。与结论不相关的分析将被省略。通常报告的过程有一些弧线,譬如先前介绍的分析结果在后面的章节中被重申,以显示它是如何支撑整个故事情节。图表在这种方法中非常重要。提纲更像是故事概述。对于每个文本页面,可能图表占据了一大半。讲故事的报告通常比其他方法的报告需要更长的时间,但是如果你的读者有耐心阅读完,那么结果将是会更深刻的(也就是说,不要试图把故事讲给路人听)。
所以,确保你有一个合适的提纲,但不要让它限制你。有一个地图并不意味着你不能半途改变你的路线(只要能到达目的地,什么路线都可以)。在构建提纲时,尽量平衡各部分,使读者有周期性的休息。但是,在每个部分中,小节的长度应与其重要性相对应。
关于作者:
作者简介:Charlie Kufs已经从事数据处理工作超过35年,开始他是一名水文地质工作者,自从二十世纪九十年代以后开始以统计学家的身份工作。他职业生涯的前24年是担任私人部门的咨询师,过去的十年则是作为一名统计学家为美国政府工作。他通过了美国质量协会的六西格玛绿带认证并且拥有许多值得称赞的出版物,包括介绍应用统计的《Stats with Cats》一书。