TensorFlow官方教程翻译2:线程和队列

原文地址https://www.tensorflow.org/programmersguide/threadingand_queues

主要内容

队列使用概述
Coordinator
QueueRunner
处理异常

队列对于使用TensorFlow来进行异步计算是一个强大的机制。
像所有的TensorFlow中的东西一样,一个队列是一个TensorFlow图中的一个节点。这是个状态节点,像一个变量:其他节点可以修改它的内容。特别的来说,其他节点可以将新的元素加入队列,或者从队列中出队现存的元素。
为了找点对于队列概念的感觉,让我们来考虑一个简单的例子。我们会创建一个“先进,先出”的队列(FIFOQueue),并且用0填充这个队列。然后,我们构建了一个图,出队一个元素,将这个元素加1,然后将这个元素放回到这个队列的尾部。于是,队列中的数字都在逐渐增加。

Example1:Enqueue and Dequeue Op

Enqueue,EnqueueMany和Dequeue都是特殊的节点。他们保存着指向队列的指针而不是一般的数值,这样使得它们能够修改队列。我们建议你将这些方法认为是和队列的方法类似。实际上,在Python的API中,他们是队列对象的方法(例如q.enqueue(…))。
注意:队列的方法(例如q.enqueue())必须和队列本身运行在相同的硬件上。在创建这些操作的时候,不一致的硬件部署指令会被忽略。
现在你应该对于队列有些感觉了,那让我们深入细节。

队列使用概述

例如像tf.FIFOQueue和tf.RandomShuffleQueue这样的队列,对于在图中异步计算张量而言,是非常重要的TensorFlow对象。
举例来说,一个典型的输入架构就是使用RandomShuffleQueue来为训练模型准备输入:

  • 多线程准备训练数据,并将其压入队列。
  • 一个训练线程运行训练操作,这个操作从队列中出队小批量的数据。

这个架构有很多好处,正如Reading data中所强调的那样,同时这篇文章也一些简化构建输入管道的函数的概述。
TensorFlow的Session对象是多线程的,因此多线程可以很容易的使用相同的图,和并行的运行操作。但是实现一个如上所述的使用线程的Python程序,并不总是那么容易。所有的线程必须能够同时停止,异常需要被捕捉并通知(reported),而队列比如在线程停止的时候,被恰当的关闭。
TensorFlow提供两个类来帮助上述任务的实现:tf.train.Coordinator和tf.train.QueueRunner。这两个类被设计为同时使用。Coordinator类帮助多线程同时停止,并向那些等待他们停止的程序报告异常。QueueRunner类被用来创建多个线程,这些线程用来协作在相同的队列中入队张量。

Coordinator

Coordinator类帮助多线程同时停止。 它的关键方法为:

  • tf.train.Coordinator.should_stop:如果线程应该停止,那么返回True
  • tf.train.Coordinator.request_stop:请求停止线程、
  • tf.train.Coordinator.join:等待,直到指定的线程已经停止

你首先创建一个Coordinator对象,然后创建一些线程来使用Coordinator。通常,线程运行循环,而这个循环会在should_stop()返回为True的时候终止。
任何线程可以决定这次计算应该终止。它仅仅需要调用requeststop(),然后其他线程会随着shouldstop()返回为True而终止。

# Thread body: loop until the coordinator indicates a stop was requested.
# If some condition becomes true, ask the coordinator to stop.
def MyLoop(coord):
  while not coord.should_stop():
...do something...
if ...some condition...:
  coord.request_stop()

# Main thread: create a coordinator.
coord = tf.train.Coordinator()

# Create 10 threads that run 'MyLoop()'
threads = [##threading.Thread(target=MyLoop, args=(coord,)) for i in xrange(10)]

# Start the threads and wait for all of them to stop.
for t in threads:
  t.start()
coord.join(threads)

显然,协调器能管理线程做不同的事情。他们并不需要像上述例子中一样,全都是做同样的事情。协调器同样支持捕捉和报告异常。参见tf.train.Coordinator文档获取更详细的信息。

QueueRunner

QueueRunner类创建一些线程,来反复的运行入队操作。这些线程可以使用一个协调器来同时终止。除此之外,一个队列运行器运行一个关系更为密切的线程,它在协调器报告异常的情况下,自动的关闭队列。
你可以使用队列UN星期来实现上述的架构。
首先构建一个图,使用TenorFlow的队列(比如tf.RandomShuffleQueue)来输入样本。然后添加操作来处理样本,并讲他们入队。最后,添加以出队元素开始的训练操作。

example = ...ops to create one example...
# Create a queue, and an op that enqueues examples one at a time in the queue.
queue = tf.RandomShuffleQueue(...)
enqueue_op = queue.enqueue(example)
# Create a training graph that starts by dequeuing a batch of examples.
inputs = queue.dequeue_many(batch_size)
train_op = ...use 'inputs' to build the training part of the graph...  
在Python的训练程序中,创建一个QueueRunner对象,会运行多个线程来处理和入队样本。创建一个Coordinator的对象,并用coordinator(协调器)来要求队列运行器来启动它的线程。编写训练的循环也可以使用coordinator(协调器)。
# Create a queue runner that will run 4 threads in parallel to enqueue
# examples.
qr = tf.train.QueueRunner(queue, [enqueue_op] * 4)

# Launch the graph.
sess = tf.Session()
# Create a coordinator, launch the queue runner threads.
coord = tf.train.Coordinator()
enqueue_threads = qr.create_threads(sess, coord=coord, start=True)
# Run the training loop, controlling termination with the coordinator.
for step in xrange(1000000):
    if coord.should_stop():
        break
    sess.run(train_op)
# When done, ask the threads to stop.
coord.request_stop()
# And wait for them to actually do it.
coord.join(enqueue_threads)  

处理异常

以队列运行器开始的线程不仅仅是运行入队操作。它们也会捕捉并处理由队列产生的异常,这些异常包括tf.errors.OutOfRangeError异常,这个异常被用来报道队列被关闭。
使用协调器的训练程序必须在其主循环中,同样地捕捉并报道异常。
这里是上面训练循环的增强版。

try:
    for step in xrange(1000000):
        if coord.should_stop():
            break
        sess.run(train_op)
except Exception, e:
    # Report exceptions to the coordinator.
    coord.request_stop(e)
finally:
    # Terminate as usual. It is safe to call `coord.request_stop()` twice.
    coord.request_stop()
    coord.join(threads)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容