当前位置: 首页 > news >正文

日本樱花服务器正品西安seo整站优化

日本樱花服务器正品,西安seo整站优化,三亚招聘网,企业网站的用户需求分析1、masked_tokens[]、token_masks[]介绍 masked_tokens和token_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。 masked_tokens列表存储经过mask处理后的分词结果。 token_masks列表存储与每个分词结果对应的mask标志。 2、示例…

1、masked_tokens[]、token_masks[]介绍 

masked_tokenstoken_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。

  • masked_tokens列表存储经过mask处理后的分词结果。

  • token_masks列表存储与每个分词结果对应的mask标志。

2、示例说明:

例如一个 masked_tokens[0]是:

['C', 'N', '[C@H]', '(', 'c', '1', 'c', 'c', '(', 'Br', ')', 'c', 'c', 'c', '1', 'F', ')', '<MASK>', '(', '<MASK>', '<MASK>', '<MASK>', 'C', '1']

token_masks[0]是:

[False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, True, True, True, False, False]

它们的长度都是28 

3、代码示例:

下面代码就是先对句子进行了token处理,然后进行了mask处理:

# 通过正则匹配对第一个句子(sents1)进行分词,得到tokens。
tokens = self._regex_match(sents1)
# 对tokens进行mask处理
m_tokens, token_masks = self._mask_tokens(tokens, empty_mask=mask)

4、mask的类型

span mask

    def _mask_span(self, ts):curr_token = 0masked = []token_mask = []mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]sampled_mask = random.choices(mask_bools, weights=weights, k=len(ts))while curr_token < len(ts):# If mask, sample from a poisson dist to get length of maskif sampled_mask[curr_token]:mask_len = torch.poisson(torch.tensor(self.span_lambda)).long().item()masked.append(self.mask_token)token_mask.append(True)curr_token += mask_len# Otherwise don't maskelse:masked.append(ts[curr_token])token_mask.append(False)curr_token += 1return masked, token_mask

随机对某些位置进行mask,从泊松区取样得到mask的长度,mask前后序列的长度可能会发生变化

replace mask

    def _mask_replace(self, ts):mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]token_mask = random.choices(mask_bools, weights=weights, k=len(ts))masked = [self._mask_token(ts[i]) if m else ts[i] for i, m in enumerate(token_mask)]return masked, token_mask

根据权重Weight随机对某些位置进行mask,mask前后序列的长度不会发生变化

权重Weight:例如,如果设定 self.mask_prob = 0.7,则掩码标记 True 的权重为 0.7,掩码标记 False 的权重为 0.3

http://www.rdtb.cn/news/2314.html

相关文章:

  • 做网站的专业术语网络营销方法有什么
  • 专业的网站设计建设百度如何快速收录网站
  • 太原在线网站建设google官网入口注册
  • 社交类网站开发石家庄新闻头条新闻最新今天
  • wordpress app后端seo工具是什么意思
  • 做网站大概需要多少钱郑州seo培训
  • h5响应式音乐网站模板简述网络营销的主要方法
  • 西安网站建设seo怎样上百度做广告
  • WordPress自建图床API西安seo计费管理
  • 做公司网站哪家好国外黄冈网站推广软件
  • app和微网站的区别是什么sem搜索
  • c 做网站起什么作用视频运营管理平台
  • 出口外贸营销网站2023年8月新冠疫情
  • 公司做的网站如何开启伪静态猪肉价格最新消息
  • 网站制作网页设计深圳网络优化公司
  • 我自己做的一个网站显示证书错误你就知道
  • wordpress怎么做背景图片西安seo公司
  • 香港云服务器哪个好seo技术教程博客
  • 如何做一个简单的网站网络推广培训班哪家好
  • 郑州做网站好的公应用商店app下载
  • 广州做网站app在线生成网站
  • app网站的电话是什么400个成品短视频
  • 玉树电子商务网站建设哪家好深圳seo网站推广方案
  • 要做个卖东西网站怎么做东莞seo外包公司
  • 淘宝客领券网站怎么做吉林网络seo
  • 网站建设用语言电脑培训学校网站
  • vb .net网站开发短期培训就业学校
  • 公司手机网站建设路由优化大师
  • 制作网页教学反思北京网站seo技术厂家
  • wordpress启用静态东莞网站推广及优化