ShapeWordle：阿基米德螺旋感知形状生成词云

IEEE引用格式：Y. Wang et al., “ShapeWordle: Tailoring Wordles using Shape-aware Archimedean Spirals,” IEEE Trans. Vis. Comput. Graph., vol. 26, no. 1, pp. 991–1000, 2020, doi: 10.1109/TVCG.2019.2934783.

摘要

本文提出了一种新技术ShapeWordle，可以创建形状为界的文字，将文字变成给定的形状。为了在形状内指导单词的放置，扩展了传统的阿基米德螺旋，通过使用形状的距离场以差分的方式来表示螺旋，使其具有形状感知能力。为了处理非凸形状，本文引入了一种多中心Wordle布局方法，该方法将形状分割成可感知形状的螺旋部分，以自适应地填充空间并生成单词位置。此外，还提供了一组编辑交互，以方便创建语义上有意义的文字，最后提供了三个评价：比较本文结果和最先进的技术WordArt，14个用户的案例研究，以及一个展示技术覆盖范围的画廊

文章简介

词云能够简单而有效地以引人入胜的方式来传达文本的概述，单词的大小表示了其出现的评率，人们可以非常容易地识别出文本的主题，此外词云算法利用字体和颜色产生美观而吸引人的输出，随着词云越来越受欢迎，开始出现各式各样的程序使得人们能够创造富有表现力的文字

已有的工具比如WordArt以及Tagxedo，允许人们创建指定形状的词云并用单词来填充，然而都不能同时达到高填充率和高数据保真度，如两个WordArt示例所示: 图a单词大小精确地编码了单词的频率，但代价是填充松散，图b通过夸大一些单词的大小来达到紧凑的填充效果。

此外，现有的工具也无法做到将话题关联成一个形状的适当部分，这有助于呈现多个主题，并可以增强词云的沟通能力。这就要求词云生成工具具备以下的三个能力

将不同主题的单词排列成形状的不同部分
直接操作单个单词
对词云的形状进行微调

因此本文提出了ShapeWordle，让人们可以在保持数据保真度的同时创建指定形状的词云。技术的核心是一个能够感知形状(shape-aware)的阿基米德螺旋，用于指导单词在文字中的位置。微分形式的阿基米德螺旋使得能够通过距离场来引导它，产生任意形式的螺旋，从而用几乎等距的文字填充任意形状。

下图是cd是WordArt和ShapeWordle对同一组输入产生的词云，可以看到c图的顶部和底端几乎都是空的，需要注意的是，为了进行公平的比较，在cd图生成的时候采用了完全相同大小的同一组单词。为了获得高填充率，即使在没有足够的单词时，ShapeWordle也能够均匀地缩放所有的单词来填充形状，同时保留它们的相对权重，如e图所示

此外，ShapeWordle通过执行贪心布局策略，在复杂形状的每个部分填充与之相关的单词，可以生成多中心布局。首先采用自动图像/形状分割方法得到有意义的形状部件，然后进行交互式微调

在词云中实现高填充率的同时允许交互式编辑是一个挑战，为了解决这个问题的，本文开发了一种混合单词表示，允许在云中编辑重要的单词，并在后续步骤填充额外更小的单词。这两组之间的划分可以通过选择使用频率最高的单词的一定比例(那些最大的大小)或者选择所有超过大小阈值的单词来完成。一旦单词被分割，所有重要的单词都被安排好，用户就可以交互操作每个可编辑的单词，改变整体形状，并细化单词和形状部分之间的对应关系。由于该编辑功能，ShapeWordle使用户能够创建语义上有意义的文字，如图中的两个例子，这是现有工具无法轻易实现的

本文通过计算布局覆盖率、布局均匀性和形状相似度来定量测量结果的质量来评估方法。结果表明，该方法能够产生紧凑的文字与形状高度相似的给定轮廓，此外邀请了14个人来使用ShapeWordle，结果展示了ShapeWordle相对于WordArt等方法的优势

总结一下，本文的主要贡献有：

制定了一个可感知形状的阿基米德螺旋来引导和对齐任意给定的形状的布局，并方便创建多中心的文字，其中不同的词被放置在给定形状的不同部分
引入了一套基于刚体操作和基于像素的放置相结合的可感知形状的词云编辑交互
对生成的词云的质量进行了定量评估，并对14名用户进行了案例研究，以说明ShapeWordle的表现力

背景

本节首先回顾Wordle的布局算法，并讨论其限制其塑造一个Wordle能力的两个固有缺陷。然后对阿基米德螺旋公式进行了简要的描述

Wordle布局算法

给出一个单词列表和与每个单词相关的权重，Wordle算法调整每个单词的大小与其权重的比例，然后使用基于样条的轮廓线表示每个单词的边界。为了使单词排列紧凑且不与更重要的单词靠近质心重叠，算法首先按权重降序对单词进行排序，然后按照以下两个步骤一次放置一个单词

初始化：在画布的中心随机选择一个位置
搜索与更新：从所选的随机位置开始创建一个螺旋，并沿着螺旋搜索放置下一个单词的位置，这样下一个单词不会与任何已经放置的单词重叠; 然后，用单词的位置更新单词云

能够在水平，垂直或对角线方向放置单词允许创建许多变体。虽然初始位置可以是完全随机的，但最终的Wordle可能不是很紧凑

弊端：这两个步骤都严重限制了Wordle在创建任意形状的单词云时的灵活性。首先，阿基米德螺旋总是以圆形的方式寻找新的位置，所以产生了Wordle不能有效的符合目标形状，其次，选择一个中心周围的初始位置会产生一个单件Wordle，阻碍多主题词云的创建。总的来说，这两个因素很大程度上归因于大多数Wordles的臃肿外形。相比之下，讲故事的词云通过将单词排列成复杂的、多部分的形状来传达语义。用户需求和Wordle功能之间存在差距

阿基米德螺线

阿基米德螺旋是应用最广泛的欧几里得螺旋之一，在极坐标下很容易定义

$r(\theta)=m\theta+b$

$\theta$是极角，$r$是到原点的径向距离，$b = r(0)$是起始点到原点的初始距离，$m$控制连续转弯之间的距离，连续匝间具有均匀间距($2m\pi$)是阿基米德螺线的一个重要而有用的特性，在医学成像、材料设计和数字光处理等许多应用中都有应用，这样的特性促进了有效的(均匀的)空间填充，可创建紧凑的Wordles

可感知形状的Wordle

本节中将介绍如何通过扩展阿基米德螺旋以实现可感知形状的Wordle，以及如何支持生成多中心的Wordle布局来实现可感知形状的Wordle

可感知形状的阿基米德螺旋

阿基米德螺线也可以用三角函数表示为笛卡尔坐标x和y

$\begin{pmatrix} x \ y \end{pmatrix}=r(\theta)\begin{pmatrix}\cos{\theta} \ \sin{\theta} \end{pmatrix}$

对上式求导可以得到

$(\frac{dx}{d\theta},\frac{dy}{d\theta})$为在$(x,y)$点时的运动方向，记为$U$，将其沿着$N=(\cos\theta,\sin\theta)^T$以及$T=(-\sin\theta,\cos\theta)^T$方向分解

其中$N$和$T$是单位法向量和单位切向量，阿基米德螺线的运动方向$U$由$N$和$T$决定，为了使螺旋在连续转弯之间的间距大致恒定，首先计算与输入形状相关的距离场(用$\varphi$表示)，然后，将$N$和$T$与$\varphi$等值线对齐，这样，当从一个形状内的起点构造螺旋时，螺旋可以按照该形状的方式运动，并最终满足形状轮廓

计算距离场

距离场是一种有效的形状表示，已用于边缘捆绑和步道数据可视化，它是一个标量字段，指定由距离变换指定的到形状轮廓的最短距离$R^2 \to R_+$

$p$是二维空间中的点，$\Omega$是形状轮廓，$q$是$\Omega$上的任意点，注意，$\varphi$在形状轮廓上为零，并向形状的中心或中轴方向逐渐增加，本文使用线性算法计算距离场，时间复杂度为$O(n)$，$n$是二维空间中的点数

延伸阿基米德螺旋

要将阿基米德螺旋扩展成可感知形状的螺旋，主要的问题是如何引导螺旋的运动，或如何定义螺旋在给定形状的任意点p上的运动方向。不用明确地构造等值线然后计算$p$点处的法线，而是取距离场的梯度为$N$。该策略可以准确地逼近连续标量场。一旦N可用，T就很容易得到，因为它是一个与N正交的单位向量，然后将式子重写成微分形式

其中$r=\sqrt{x^2+y^2}$，然而，在任意形状的每个点上使用相同的q可能是不合适的，因为生成的螺旋可能不能适应高曲率的区域，例如，靠近圣诞树的角落

为了刻画这种尖锐的特征，考虑了沿螺旋的局部曲率，并通过小的切向运动来近似曲线(用ds表示)垂直于$N$的$Rd\eta$和$rd\theta$，其中$R$是局部曲率半径，$h$是用户指定的角速度参数。这样做，我们可以写

注意，Eq(4)中的$r$也可以看作是定义在一般距离场$\varphi$的等值线(同心圆)上的局部曲率半径，$R$是可感知距离场$\varphi$的等值线上定义的局部曲率半径，为了估计$\varphi$中任意点上的$R$，本文使用Hessian矩阵，把所有东西放在一起，可以把Eq(4)重写为

注意，$R$和$r$在不同的点上是不同的，而$m$和$d\eta$是用户指定的常数参数

本文使用Eq(6)计算$dx$和$dy$，从原点开始逐步跟踪螺旋，通常设$m = 1, d\eta=p=5$，而$m$和$R$在形状图像上以像素为单位进行测量，由于$m$是一个常数，所产生的螺旋在连续转弯之间可以有接近均匀的间距($2mp$)

图中显示了一些示例。在直线曲线段R可能过大的情况下，为了避免过度移动，团队经验性地设置了1.5像素单位的最大切向移动距离上界

作者在一台四核PC上运行该方法，23寸液晶宽屏，Intel(R) Core(TM) i7-6700K CPU, 16GB RAM。对于一个60个单词的词云，完成不到5秒

均匀定标

将形状感知阿基米德螺旋加入到Wordle布局算法中，可以有效地生成形状感知wordle，但是，如果单词总面积远远小于形状总面积，就很难创建一个图形紧凑布局。因此，本文为单词定义了一个统一的缩放参数，以使填充率最大化，同时保留单词之间的相对权重

多中心布局

对于包含多个组件的输入形状，本文使用可感知形状的阿基米德螺旋为每个组件生成Wordle布局。图中显示了一个具有三个组件的示例，示例生成了一个多主题，通过在每个组成部分:郁金香，春天和花球中填充一个特定主题的词来Wordle

但是，如果一个组件有多个距离字段的局部最大值，为整个组件生成Wordle布局可能无法完全填充它。图中所示的形状有两个分量。在右翼部分只追踪一个从整体最大值开始的单一螺旋，就会错过机翼的顶部，造成大面积的空区

为了让Wordle算法适应这种非凸组件，使用一个多中心布局来生成螺旋，并在多个局部最大值周围放置单词。

形状分割

给定一个形状，本文做法是检测形状中的连通分量，并为每个分量生成一个距离场，然后使用迭代的梯度下降程序来定位每个组件中的局部最大值和相关的形状区域，这允许隐式地将一个组件分割为几个部分，下图显示了一个例子，其中两个组成部分的鸽子形状被分割成四个部分

词填充

给定要填充形状的单词列表，首先对每个单词设置字体大小，使所有单词的总面积占形状总面积的70%，然后使用贪心策略将单词分配给形状的不同部分，记$p_{i,j}$为地$i$个分量的第$j$个部分，$A_{i,j}$为$p_{i,j}$的面积，N是总共输入的单词数量，那么$p_{i,j}$的单词数为

假设权重最大的单词应该分配给最大的部分，定义每个部分中单词的最大权重为

一旦$n_{i,j}$和$w_{i,j}$被决定下来，同时从输入的单词列表中随机分配单词到每个部分，使得$p_{i,j}$中任意一个单词的权重不超过$w_{i,j}$。如果由于这样的分配耗尽了放置单词的空间，那么一致地缩小所有单词，并重复单词分配过程，通过跟踪每个部分的局部最大值，用文字填充非凸形状，结果如图所示

ShapeWordle交互式系统

在本节中将介绍ShapeWordle系统，该系统可以方便用户交互式地创建和编辑任意形状的单词云，同时保持其审美特征。与现有的单词云编辑系统一样，ShapeWordle允许用户通过对单个单词和形状的交互操作来控制布局，在这些之上，如图所示的管道所示，用户可以简单地加载一段文本并加载/选择一个形状(a)，应用一个形状分割(b)，并点击一个按钮来生成一个单词云，完全填充给定的形状

在生成布局之前，用户可以手动将语义相关的单词关联到特定的分段部分，从而创建多主题文字处理，如果分割的部分是没有意义的，可以通过交互的方式进行细化，单词云生成后，用户可以通过各种编辑操作进一步操作重要的单词，然后把不太重要的单词填入最后一个单词，下文描述如何用两步布局完全填充一个形状，并执行交互式单词云编辑

two-step布局

即使将所有的单词统一缩放，也不一定能够完全填充一个形状，另一方面，用户在浏览单词云时，主要被大单词所吸引，而对小单词的关注较少。为了有效地填充一个形状，本文将输入单词分成两类:核心单词是最上面的N个可以交互操作的重要单词，而边缘单词用于填充空间。为了提供保持一致性的词云编辑，本文用核心词的边界框表示其布局，在编辑阶段将其视为刚体，与核心词相比，每个边缘词都以“1”为前景，“0”为背景的二值掩码图像表示

使用这个组合表示来生成两个步骤的布局，即：放置核心词，然后边缘词，首先，使用可感知形状的阿基米德螺旋来定位核心单词，以便它们的整体形状更好地与输入形状对齐。注意，如果没有足够的核心单词，布局可能不会被完全填充，为了清楚地显示核心字，本文均匀地扩大他们，直到他们支配形状区域的大部分，与之相反，边缘词则使用传统的阿基米德螺旋，原因有二，首先，大量微小的边缘词主要用于填充形状中剩余的小的空白区域，它们不需要与形状对齐，其次，对大量微小的边缘词计算形状感知的阿基米德螺旋是费时的，也是不必要的

ShapeWordle编辑

创建好Wordle后，用户可以在编辑模式下对其进行操作，在编辑模式下，边缘词消失，用户可以交互修改核心词(如移动、旋转、调整大小、删除)，同时保留核心词之间的邻域关系，操作完成后，用户只需点击一个按钮，就可以用边缘文字填充整个形状

在编辑模式中，每个单词被框为带有质量的刚体，应用自定义刚体动力学对单词进行力的移动。动力学系统允许通过施加非穿透约束来避免词语重叠，自动检测物体之间的碰撞并将相关的物体分开来响应碰撞。这样，在用户移动/调整单词大小后，周围所有相关单词将自动重新定位。为了支持直观的基于形状的编辑，这里使用两个附加约束自定义刚体动力学:

为了使文字保持在对应的形状部分内，采用边界约束将形状边界像素作为静态刚体。如果一个字与他们接触，它会被弹回来。如果整个单词(或重要部分)超出了边界，那么就假设用户有意地将单词从该部分中取出，因此不会将边界力应用到该单词上

删除文字会导致布局中出现大面积的空白区域。为了保持布局的一致性，引入了一个一致性约束来插入虚拟体来表示空白区域，并使用中央力来拉入周围的单词。

评估

本节一共做了三件事情

定量评估比较ShapeWordle与SOTA模型
个案研究
如何扩展ShapeWordle用于制造临时形状的Wordles

定量比较

有两种现有的工具可以自动生成带有形状的单词云：WordArt 和 Tagxedo，对于Tagxedo，作者发现如果不能适应布局中的单词，可能会丢失重要的单词，与输入数据不相符。因此，文中主要将ShapeWordle与WordArt进行比较，后者是迄今为止生成单词云的最佳工具，但是，由于WordArt的算法和代码是不可访问的，只能从WordArt获得常规RGB图像形式的输出，因此，为了与WordArt进行比较，使用ShapeWordle生成与WordArt相同分辨率的常规RGB图像

本文使用以下三个度量来定量地评估生成的单词云的质量

布局覆盖 (Layout coverage，LC)

LC是对Barth et al的扩展，用于测量生成布局中的整体空间比例。为此，本文用文本颜色计算像素的数量和形状内非文本背景色的像素数。因此，LC值越大，越接近1，覆盖率越高

布局均匀性 (Layout uniformity，LU)

这个度量从另一个方面度量了布局中单词之间的间隙分布的均匀性，满足了wordles的基本要求。本文根据以下观察来构建LU:如果一个布局中的单词是均匀分布的，那么单词之间的间隔应该很小并且大小相似。因此，给定单词的布局，首先生成一个像素级的距离字段(记为$\varphi$)，每个像素以文本颜色存储到最近像素的距离，因此定义了LU，将每个像素的平方距离值相加，并通过形状内非文本像素的总数对总和进行规范化

其中$p_i$是形状内的第$i$个像素，在这里，一个小的LU表示一个更好的布局均匀性，用平方距离值来惩罚较大的距离

形状相似性 (Shape similarity，SS)

第三个度量标准SS旨在衡量生成的wordle与给定形状的一致性如何，这里作者采用最小距离模型来度量每个边界像素的距离，对于形状轮廓上的每个像素$\Omega_B$，找到距离(记为$\rho$)到形状中最近的文本颜色像素，这样，可以通过对形状轮廓上每像素的平方距离求和来定义SS，并以形状轮廓上的总像素数($n_contour$)对其求和进行归一化

与LU类似，小的SS表示更好地匹配输入形状轮廓的布局

关于数据保真度，本文没有明确地将其作为一个度量，因为本文方法已经完全尊重了单词的原始权重。为了进行公平的比较，还有意地将WordArt设置为产生充分尊重数据保真度的布局

数据

本文使用来自Brath et al的数据集，其中包括112篇文章摘自英文维基百科，45篇科学论文摘自SEA和ALENEX会议记录，此外，收集了157个不同类别的形状，如动物、植物、运动和数字，然后为每个文档随机分配一个独特的形状，为了检查ShapeWordle如何在单中心和多中心的Wordles中表现，进一步将形状分为两种类型:单部分形状和多部分形状

设置

由于WordArt的算法和代码不可用，本文试图使用更一致的设置来比较ShapeWordle和WordArt，首先，使用对偶字体以水平方向绘制这两个系统中的所有单词。其次，WordArt如何将单词频率(或权重)映射到生成的单词的字体大小是未知的，因此，首先使用WordArt来生成一个单词布局，然后直接将生成的单词的字体大小(在下载的CSS文件中提供)作为ShapeWordle中的输入单词的权重，第三，虽然WordArt和ShapeWordle都可以用大量的小单词完全填充一个给定的形状，但是为了评价一个布局的质量，主要考虑那些更能吸引用户注意力的大的重要单词的布局，此外，使用更少的单词来更均匀地生成形状的单词云实际上更具挑战性，考虑到这些因素，本文将单词数量定为60个，这通常不足以完全填充输入形状

结果

作者使用这些方法和WordArt为整个数据集生成形状单词云，并计算每个结果的LC、LU和SS分数，所有生成的word clouds的截图以及它们的LC、LU和SS分数可以在补充材料中找到。此外，还创建了如图所示的箱线图，以汇总得分

一般来说，较大的LC值表示布局覆盖率较好，不可能达到接近1的值，因为LC只计算形状中的文本颜色像素。LC值的比较结果如图所示

WordArt是没法通过统一放大单词来提高覆盖率的，但是得益于形状感知的阿基米德螺旋，ShapeWordle可以通过这种方式来提高覆盖率

另一方面，LU和SS测量像素级的平方距离，以考虑布局的均匀性和形状的相似性。LU值越小，说明布局均匀性越好，结果中单词之间的间隙越小，越均匀;SS值越小，说明单词与形状轮廓的匹配性越好，再次感谢形状感知阿基米德螺旋，它使系统能够生成更加统一的形状感知布局。因此，可以更均匀地分布单词在形状中，同样，ShapeWordle可以达到更低的SS值，因为螺旋更好地符合给定的形状

此外，比较单中心形状和多中心形状的结果，我们可以看到两者的LC、LU和SS分数都下降了，这是合理的，因为多中心布局通常包含多个较小的部分，在这种情况下，填写与各个部分更好匹配的单词会比较困难。然而，ShapeWordle仍然为单中心和多中心形状生成更紧凑和均匀分布的单词

案例研究

为了探究ShapeWordle的表达能力，作者对来自当地大学不同学校的14名参与者进行了案例研究。在这项研究中，向参与者展示了ShapeWordle的所有功能，并要求他们创建一个自己喜欢的布局，团队仔细观察他们的行为，在他们完成之后，对他们每个人进行了简短的访谈，以收集他们的设计理念和对系统的反馈，每个案例大约需要5-20分钟，包括设计过程和交互。所有的参与者都认为创建过程很有吸引力

各个图的设计理念和过程见原文，此处略过

时态数据的扩展

最后，本文将该方法扩展到使用时变文本数据生成时态形状文字。Morphable word clouds是生产时态形状文字机的最新技术，但它需要解决一个复杂的刚体动力学系统，多亏了能感知形状的阿基米德螺旋，可以用更简单的策略实现这个目标。给定一段时间内的一组图形，首先准备连续图形之间的对应关系，因此，在为第一个形状生成布局之后，可以参考该布局来指导下一个形状中的单词放置。通过这种方式，可以在考虑时间一致性的同时，随着时间的推移而产生成形状Wordles

上图是两者的比较，图a是ShapeWordle，图b是Morphable word clouds，可以看出前者显然更紧凑

总结

本文介绍了ShapeWordle，一种便于用户创建任意形状Wordles的技术。这项技术的核心是形状感知阿基米德螺旋线，用于引导单词在Wordle内的位置，过将阿基米德螺旋以微分形式表述出来，可以利用该形状的距离场来产生任意形式的螺旋，从而产生可感知形状的涡旋，对于复杂的形状，引入了一种多中心Wordle布局技术，它首先将形状分割成多个部分，然后使用可感知形状的螺旋自适应地将单词放置在每个部分中，为了允许用户交互地编辑单词，同时密集地填充形状，本文进一步开发了一种混合单词表示，它可以编辑云中重要的单词并填充其他的小单词，此外，还提供了一组编辑交互来促进语义上有意义的创建wordle。通过定量比较本文系统和最先进的工具来评估它，进行案例研究，并提出了一个生成时间词云的扩展

ShapeWordle仍有一些局限性，目前的多中心形状在紧凑性和统一性方面不如单中心形状，其次，虽然目前的方法可以以一种感知形状的方式放置单词，但它不能自动改变单词的方向，并使单词与形状保持一致，比如将鸽子的特征中的单词对齐，需要花费参与者大约7分钟的时间，作者将研究在未来将形状定位纳入螺旋的可能性。最后，将探索更多的应用形状感知阿基米德螺旋可视化的情况

演示地址论文地址

ShapeWordle：阿基米德螺旋感知形状生成词云

摘要

文章简介

相关工作

词云可视化

邻域图

空间信息

时间连贯性

交互式编辑

基于螺旋的可视化

背景

Wordle布局算法

阿基米德螺线

可感知形状的Wordle

可感知形状的阿基米德螺旋

计算距离场

延伸阿基米德螺旋

均匀定标

多中心布局

形状分割

词填充

ShapeWordle交互式系统

two-step布局

ShapeWordle编辑

评估

定量比较

案例研究

时态数据的扩展

总结

🍊欢迎光临本站