每一个互联网公司都要掌握的《计算广告》,它是数据与计算的灵魂

字数 8035阅读 35

互联网的快速发展改变了整个世界。从门户网站到搜索引擎,从社交网络到电子商务,从免费Wi-Fi到应用市场,层出不穷的在线服务方便了人们的生活,甚至颠覆了原有的产业。更为神奇的是,这些服务大多是免费的。在今天,“互联网思维”这个名词被越来越多互联网行业内外的人们追捧和畏惧,而其中很多人的困惑都在于:这么多免费的服务是如何获得收入,乃至赚得盆盈钵满的呢?实际上,如果把多样的互联网产品或服务看成各式硬币的正面,那么我们会发现,其中许多硬币的背面都有着一样的图案,这就是以广告为核心的后向变现体系。正面的免费服务是为了获得流量和数据,而背面的广告业务则将这些流量和数据变成金钱。这就是互联网最关键的思维模式之一。

在能够获得充分的流量或高价值的数据后,我们认为,所有能够传播信息的商品,其售价都会趋向其边际成本。这样的观点对许多传统行业商业模式的影响是深远的,也是我们认为大家应该在互联网时代深入了解广告、了解变现产品的原因。因此,本书虽然以介绍互联网广告的产品和技术为核心,但并不是想让大家都学会搭建一个广告系统。本书的核心目的,是让读者在清晰地了解互联网广告全貌的基础上,在遇到与后向变现相关的产品问题时,能够以合理的思维逻辑和背景知识来应对。实际上,在互联网时代,不论你身处哪个行业,只要用心留意,就会发现这类问题可能比你想象的更为常见,也更为重要。对其中最重要的几类问题,我们来看看下面几个具体的例子。

(1)商业模式探索。例如,电影是一种边际成本很低、信息传播量又很大的典型商品。那么现在电影的票价为什么这么高?能否探索一种售价很低,而充分利用其信息传播能力的电影行业发行模式,获得更高的经济效益和社会效益?

(2)流量变现。例如,互联网电视厂商除了硬件销售的回报以外,还可以获得一部分用户流量。这些流量的性质和价值如何,应该以什么样的方式变现?

(3)数据变现。例如,室内导航技术是近年来快速发展的新型互联网应用,如果以向用户免费的方式运营室内导航产品,会得到什么有价值的数据资产,从而支撑相应的后向变现,又应该采用哪种具体的商业产品来支撑?

(4)商业产品建设和运营。例如,团购、游戏联运、返利购买、积分墙这些推广模式与一般的展示广告或搜索广告有什么内在联系?是否可以共用某些产品和技术平台?

这4类问题的典型性和价值不言而喻。不过,要回答这些问题,仅靠独立的深入思考是不够的,还必须对当前互联网流量和数据变现市场的商业逻辑和产品现状有相当程度的了解,并在需要具体产品实施时有相应的方案可以参考和选择。为读者提供这方面的帮助,正是本书希望做到的。

从传统的视角看广告,会有人认为互联网服务中的广告破坏了用户体验。这实际上是一种观念上的误解。首先,互联网广告不再像线下广告那样,以宣教性的横幅为主,而是以各种自动决策的付费信息的方式存在,这其中既包括传统的创意形式,也包括游戏联运、团购、返利、原生广告等更加契合用户意图的新传播形式。另外,虽然从微观上看,部分不顾及媒体价值、盲目变现的广告产品确实存在破坏用户体验的问题,但从宏观上看,恰恰是因为广告这一后向变现模式的存在,互联网产品的整体用户体验才达到了前所未有的高度。在传统企业中,一般会根据产品线分设若干事业部,每个事业部在研发自己产品的同时,还要对营收和利润负责。而在互联网企业或者按照互联网方式运营的企业中,还存在另外一种组织方式,即面向用户的免费产品部门只负责优化产品体验,不对营收负责,而专门面向客户的商业产品部门通过广告等后向变现方式为企业创造营收。实践证明,在这样的组织方式下,用户产品部门往往能够心无旁骛,专心为了提高用户体验而努力。因此,我们会看到,比起传统软件企业,互联网企业的产品在把握用户需求、优化用户体验方面往往能够做得更加优秀。

因此,在互联网的世界里,广告不再只是广告公司的事,而是每一个互联网公司都要关心的事。从结果来看,在线广告实际上成了互联网最重要的“发动机”。从营收上看,它支撑着互联网业务的大半壁江山。当然,广告的概念本身在互联网业务中也已经发生了脱胎换骨的变化。首先,在互联网广告中,服务于中小商家、以直接销售为目的的广告取代品牌广告成为主流,这也创造了全新的巨大市场;其次,它的关键不再是创意、策略等人工服务,而是以数据支撑的流量规模化交易为典型特点。也就是说,机器和算法取代了人员与服务,成为在线广告最鲜明的特色。可以说,互联网广告的灵魂就在于数据与计算,因此,也就产生了“计算广告”这个名词,以及其背后复杂的产品与技术。

计算广告这个课题在以Google AdWords为代表的竞价广告业务产生以后逐渐成形,并且在展示广告进入程序化交易阶段以后愈加成熟,而将其整理成一个新的研究方向,则要归功于时任Yahoo!广告首席科学家的Andrei Broder。他在斯坦福开设的“Computational Advertising”这门课,第一次全面而系统地介绍了在线广告中的计算挑战,以及工业界中的实用算法。

既然有了计算广告的相关课程,为什么还要再编写这本计算广告的书呢?首先当然是因为这一领域变化太快,在“计算广告”这个词诞生后的几年里,它的内涵和外延都已经发生了重大的变化,而且这几年的变化使这个领域逐渐完备起来。因此,有必要在此时对当下的计算广告领域做一个阶段性的小结。另外还有一个重要原因,那就是我们在几次计算广告的教学实践中发现,对在校学生或者刚刚接触此领域的人来说,最主要的理解障碍不在于算法和技术本身,而在于广告的商业逻辑和产品目标。以此为出发点,本书将以广告产品为核心进行组织。在清楚地了解计算广告的产品逻辑与商业价值的基础上,我们再有针对性地讨论其中的算法和架构问题。因此,商业逻辑驱动的在线广告产品和技术的升级,将是本书最重要的一条主线。

计算广告 互联网商业变现的市场与技术 第2版

作者: 刘鹏 ,王超

【京东预售】【当当预售】

本书第 1版出版以后,获得的业界反响超乎了我们的想象。实际上,本书已经广泛被互联网公司采用,作为商业化相关部门的培训教程,甚至还成了某大公司商业化部门年会时的”阳光普照奖”奖品。

经过一段时间的补充与修订,我们向读者奉上这次的新版,希望本书能帮助读者深入了解互联网流量与数据变现,洞察互联网增长与财富的秘密,搭建商业化与获客的产品技术体系。

另外,本书还有一条潜在的主线,即数据的加工、利用与交易。熟悉计算广告业务和产品的读者会有认识,广告业务的收益只能来自3个方面,即数据、流量或品牌属性。其中后两点是媒体的专属,而大量的广告平台在做的事情,主要就是数据的加工与利用。不夸张地说,计算广告对于数据利用的广度和深度是空前的,而且产业的各个环节也是比较完备的。在各行各业都在强调大数据思维与方法的今天,深入了解计算广告产品与技术具有特别强的范本意义。因此,我们在内容组织上将特别强调数据这条线索,努力将广告产品进化过程中是如何一步步更有效利用数据的这一点解释清楚。

当下人工智能的火热,也让我们从这个视角重新审视计算广告业务的本质。实际上,人工智能在今天的快速发展,正是得益于深度学习的计算效率大大提高以后对大数据的挖掘和使用能力大大加强。而广告领域最重要的特点也是处理的数据规模巨大,并且机器对这些用户行为数据的解读潜力远远大于人类制定的规则。在计算广告发展的第一阶段,虽然我们已经在处理大量的数据,但用的方法往往是比较浅的模型,但是今天,以深度学习为代表的方法论和技术,正在计算广告领域得到越来深入的应用。在这一版中,我们也将对深度学习的基础方法论及其目前在计算广告中的关键应用进行介绍。

本书的读者对象

既然在线广告不再只是广告公司的事,那么需要了解这一业务及其背后产品技术的人群也就相当广泛了。我们希望下面几类读者可以从本书中找到有价值的内容。

(1)互联网公司商业化部门的产品、技术和运营人员。对互联网公司来说,商业化产品中最重要的就是广告产品,不过我们发现,囿于各公司具体的产品形态,仅从自己的业务中了解广告产品技术的全貌并不容易。因此,本书最主要面向的读者就是与这些广告产品相关的人员,希望他们通过阅读本书,对互联网广告的全貌以及复杂的技术产品系列有整体的了解,避免“只见树木,不见森林”。

(2)对个性化系统、大数据变现或交易有兴趣者。计算广告在各种个性化系统中具有典型性,又因其商业逻辑而相对复杂;此外,计算广告还催生了对大规模数据利用和变现的直接市场。因此,推荐等个性化系统的产品技术人员,以及大数据相关的产品技术人员,都非常有必要通过了解计算广告的产品和技术,对个性化系统架构约束下的效果优化、大数据变现和交易等诸多问题在实际工业界的落地有一定的理解。

(3)传统企业互联网化进程的决策者。传统企业在互联网化的过程中,需要借鉴的绝不仅仅是利用互联网的技术和产品,更重要的是按照互联网企业形成的高效运营和变现模式来改造传统业务。从这个意义上说,互联网企业以广告为基础的后向变现体系是整个互联网化过程中至关重要的一环。因此,在这样的传统企业中,互联网化进程的决策者对广告的原理和市场必须有一定程度的了解。

(4)传统广告业务的从业者。传统广告业务与互联网广告业务既有密切的联系,又存在着巨大的差别。以技术为导向、精准地面向受众的广告策略,正深刻地影响着整个广告市场。同时,随着互联网广告规模的迅速扩大,这样的策略越来越为广告主接受和青睐。因此,传统广告业务的从业者必须要顺应潮流,理解和运用计算广告的方法与策略,将线下资源与线上资源整合起来,才能更好地服务于广告主和媒体。

(5)互联网创业者。我们接触过不少互联网行业的创业者,对他们来说,找到用户产品的痛点并漂亮地解决往往并不是十分困难。但是,一个企业最终需要的是利润,而许多对变现逻辑和思考方法不熟悉的创业者,往往面对产品得到的流量和数据不知所措,而商业化进程的缓慢也会大大拖慢用户产品的运营进度,甚至因此错过企业的黄金发展机会。从这个意义上说,了解一些流量与数据变现的思路,无疑会对创业方向的选择、创业过程的加速、创业果实的收获有巨大的帮助。

(6)计算机相关专业研究生。计算广告人才在互联网行业相当稀缺,而目前学校的教育对这种与工业界关系密切的实际问题是有些脱节的。我们整理本书的一个重要目的,是希望为具有一定的计算机科学基础并且对工业界实际问题有兴趣的学生提供一些指导,让他们对思考和设计商业产品、运用技术解决产品问题形成正确的思考方法。

本书的内容组织

前面说过,我们整理本书并不是简单地为了介绍计算广告的产品和技术,更重要的目的是希望提供一个新的视角,让大家通过了解广告变现的内在逻辑,进而对互联网时代的用户产品如何将体验做到极致、将变现做到最高效有宏观的认识。在我们看来,如果不了解广告变现产品和市场,就谈不上真正透彻地了解互联网,也一定会在用户产品的设计和运营上有诸多掣肘。出于这样的目的,本书在核心内容组织上包括以下3个部分。

第一部分是在线广告市场与背景,这部分介绍在线广告领域的一些基本问题和背景知识。虽然内容比较容易理解,但这部分是全书的基础,特别是很多相关概念和术语的集中介绍,请不要略过。

第二部分是在线广告产品逻辑,这部分主要面向产品、运营和销售等人员,以及互联网产品的宏观决策者,其内容重点是介绍计算广告的市场结构、交易模式和主要产品。这部分内容将以在线广告产品发展的顺序展开,希望能帮助读者理解各种复杂的广告产品和交易机制产生的内在规律。

第三部分是计算广告关键技术,这部分主要面向系统工程师、算法工程师和架构师。与前一部分的广告产品相对应,这部分也以在线广告产品发展的顺序展开,重点阐释实现各种广告产品的关键技术挑战,并提供基础的解决方案。

一般来说,对于那些想运营在线广告业务,或者想了解如何用在线广告对用户产品进行变现的读者来说,可以重点阅读前两部分,并且对其中的产品与商业逻辑要深入理解;对那些重点关注工程实现和收入优化的读者来说,在了解了前两部分之后,还要花一些精力深入阅读第三部分,特别是其中与自己关注的广告产品相关的技术章节。计算广告这个领域的复杂性在于,对于任何一项产品或技术,都需要放在相应的商业背景下去判断其合理性,而要理解商业产品上能达到的目标,又需要对技术的现状和难点有相当的认识。因此,我们推荐的阅读方式还是尽可能地通读全书,对其中确实不相关或者知识背景上无法理解的部分简单跳过就可以了。

在讨论在线广告市场产品技术的过程中,会涉及大量的术语和专业名词。对于对变现业务不太熟悉的读者,这些术语会给阅读带来一定的障碍。为了帮助读者检索和查找术语的相关内容,我们在附录中对主要术语及缩写给出了索引,以方便阅读。

由于篇幅限制,本书中有些内容的细节或背景知识无法全面展开,在这种情形下给出了相应的参考文献。但是,由于本书并非学术著作,在引用文献时并不会保证完备性,因此当正文足以说明观点和方法时,其原始文献不一定还会列出,请读者谅解。另外,在本书的第三部分中,为帮助读者理解,会对一些比较关键的算法给出相应的代码片段。不过本书中的代码都是示例性代码,目的只是更清楚地描述逻辑,而并非可以直接编译执行的程序,其中一些特别容易理解和实现的子函数调用,也可能会略去其具体实现。

业界评论:

书的内容主要是由刘鹏在清华的公开课以及在北大、北航的研究生课程内容整理加工而成的,并且在整理过程中针对更广泛的读者群体做了内容本身和顺序上的调整。在两位作者中,刘鹏为主要执笔者,负责主体部分的写作和内容的整体组织,王超负责其中产品案例和算法示例代码的部分。由于作者的水平有限,再加上时间仓促,书中难免出现错漏之处,敬请各位读者多多批评指正。此外,在本书撰写的过程中,我们邀请了一些业内的专家和从业者帮助对内容进行把关,得到了他们很多有益的建议,这些建议使本书更加完备和实用,我们在此一并表示感谢,并将其中部分专家对本书的评语附在书中。

来自互联网公司管理层

在线广告市场是比较复杂的体系,它涵盖了互联网生态链的各种角色。本书既从商业角度介绍了在线广告,也深入到了广告的技术和算法层面,还涉及了大规模竞价市场在市场设计方面的相关原理和优化手段。这本书不仅是了解在线广告市场的途径,也是了解互联网商业和盈利模式设计的窗口,对于互联网产品设计也有很好的参考作用。

——王华,前阿里巴巴副总裁,阿里妈妈负责人

这是一本非常系统、全面地介绍计算广告的书,一本在线广告专业人员必读的书,一本值得强烈推荐给想利用互联网力量的企业主和决策制定者以及对大数据价值感兴趣的研究人员和工程师的书。虽然我亦曾目睹广告业在20 世纪90 年代开始的革命,一直积极参与在线广告的演变,但阅读完这本书,我对计算广告整个图景以及很多细微之处有了更多更深刻的理解。

——毛建昌,微软Distinguished Engineer 和Bing 广告工程负责人,前雅虎实验室广告科学副总裁

十多年的实践证明,互联网最有效的商业模式莫过于可以把流量直接变现的在线广告模式。从最初铺天盖地的横幅广告起步,到人群及兴趣精准定向的搜索广告与推荐引擎,再到与内容环境融为一体的原生广告,用户需求与口味的不断变迁促使广告产品与技术持续不断地升级与发酵。本书最大的亮点在于,作者从中国互联网广告发展全过程亲历者的视角,极为系统地讲述了计算广告的产品设计思维与技术理论基础,涵盖从广告呈现到计价策略乃至算法实现并直接运用于互联网流量变现课题的方方面面。无论是产品经理还是工程师,只要准备投身于这一互联网最大的金矿领域,本书就是手边必须常备的工具书与教材。

——刘子正,有信CEO,微博研发副总经理

本书内容全面且与时俱进,对核心技术的介绍深入浅出,是计算广告领域一本难得的好书。本书视野宽阔,涵盖了在线广告市场及核心技术的各个方面,除主流技术以外,对一些其他著作很少涉及的方面,如广告创意优化、反欺诈、隐私保护等也进行了介绍。本书内容新颖,把近年来涌现的一些新的广告形式和技术,如实时竞价的广告交易、原生广告等,都囊括其中。另外,本书行文流畅、逻辑清晰,对核心技术的介绍深入到位,包含了重要的算法细节以及理论探讨,对计算广告的从业者而言,是一本非常实用的参考书。

——刘铁岩,微软亚洲研究院首席研究员

刘鹏博士是我以前在微软工作时的同事,他博学睿智,融会文理,给我留下深刻印象。他将多年积累的相关经验与成果整理成一部正式出版的计算广告著作,值得向大家强烈推荐。本书将该领域的实际商业问题与技术解决方案结合起来,让读者对计算广告的理论与实践、应用与技术、系统与方法有全面深入的了解和认知。对于已经掌握了机器学习、数据挖掘技术想进入计算广告及其相关领域的从业者、技术人员、教师和学生,这是一部实用的指南。

——李航,字节跳动人工智能实验室总监,前华为诺亚方舟实验室主任

我们的团队花了大量精力查找相关资料和文献,却一直苦于没有一套相对完整的知识体系来帮助我们的业务和技术人员加快学习、少走弯路。因此,我期待这样一本书的出现至少已经有两三年的时间。作为一个方兴未艾而发展迅猛的新兴产业,我相信刘鹏的这套科学且实际的知识体系,将对数字营销领域的同仁有非常大的指导作用。程序化营销、大数据应用是发展异常迅猛的产业,涉及大量的产品、工程以及算法方面的知识,也涉及相当多的商业逻辑的深刻洞察。而刘鹏通过对产业内在逻辑的诠释和推演,阐述了程序化营销产业的发展,对真正把握大数据给各个产业带来的深刻变化和影响,具有深刻的指导意义。

——杨炯纬,360高级副总裁

如果说当年雅虎广告首席科学家Andrei Broder 在斯坦福开设的课程第一次把计算广告学作为一门学科,那么本书堪称这门新兴学科的标准教科书,因为它是首次全面系统地阐述计算广告学的著作,覆盖了商业逻辑、产品结构、关键技术、工程实践和应用实例。在内容结构编排上,本书由浅入深地讲述了从宏观背景到技术细节、从经典的搜索广告到最新的实时竞价等诸多内容,既适合作为从事在线广告的商务运营人员的参考书,也适合作为一线技术开发人员的实战指导。

——余凯,地平线公司创始人,前百度深度学习实验室主任

互联网业内人士都清楚流量的作用,流量之于互联网,正如血液之于人体。不同之处在于,互联网上的流量是趋利的,变现能力决定了流量的方向和价值。计算广告是流量变现最重要的方式之一。只有了解了互联网广告的精髓,才能真正懂得互联网上流量的奥秘,也才能懂得互联网的奥秘。本书作者对互联网广告的市场、产品和技术做了全面、深刻的剖析,为业内外人士理解并踏入这个领域提供了一条捷径。尽管本人从事互联网广告研发多年,也是第一次读到如此系统的著作,受益匪浅!

——沈抖,百度高级副总栽

计算广告近年来特别热,全球大小互联网公司有大量的算法工程师、系统工程师、数据科学家在从事与此相关的工作。正如刘鹏在书中指出的,流量变现和数据变现是很多互联网公司商业模型的核心。虽然学术界和工业界有大量与计算广告相关的文章,但或侧重于算法,或侧重于系统,抑或侧重于商业逻辑,却很少能像本书一样把这几个维度融会贯通地串在一起,既有连贯性、有广度,又有足够的深度。刘鹏过去几年中花了大量的精力在清华大学、北京大学以及一些在线教育平台分享他对计算广告的深刻理解,影响了不少人,我过去和现在的团队都有他的粉丝、他的学生。现在刘鹏又把他对计算广告的深刻理解集结成书,能影响到更多的人。为刘鹏点赞!

——张小沛,瓜子二手车CTO,前宜信CTO,前Hulu 全球副总裁

目录结构

第一部分 在线广告市场与背景

第1章 在线广告综述3

第2章 计算广告基础20

第二部分 在线广告产品逻辑

第3章 在线广告产品概览33

第4章 合约广告41

第5章 搜索广告与竞价广告53

第6章 程序化交易广告78

第7章 数据加工与交易99

第8章 信息流与原生广告115

第三部分 计算广告关键技术

第9章 计算广告技术概览137

第10章 基础知识准备154

第11章 合约广告核心技术181

第12章 受众定向核心技术201

第13章 竞价广告核心技术220

第14章 点击率预测模型247

第15章 程序化交易核心技术272

第16章 其他广告相关技术286

第四部分 附录

附录 主要术语及缩写索引311

参考文献317

推荐阅读更多精彩内容