Press "Enter" to skip to content

原力计划【NLP】学不会打我 半小时学会基本操作 13 孪生网络

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

【NLP】:warning:学不会打我! 半小时学会基本操作 13:warning: 孪生网络

 

从今天开始我们将开启一段自然语言处理 (NLP) 的旅程. 自然语言处理可以让来处理, 理解, 以及运用人类的语言, 实现机器语言和人类语言之间的沟通桥梁.

 

 

孪生网络

 

孪生网络 (Siamese Network) 是一个共享权重的连体神经网络. 孪生网络可以处理同时有两个输入的问题, 如图:

在 NLP 中, 孪生网络的架构通常由权重共享的两个 LSTM 网络架构组成, 在计算句子相似度等场景有广泛的应用.

 

伪孪生网络

 

伪孪生网络 (Pseudo-Siamese Network) 是一种类似于孪生网络 (Siamese Network) 的网络架构. 相较于孪生网络, 伪孪生网络拥有相同的 2 个网络架构 (或相似), 但是不进行参数的共享.

 

 

使用孪生网络判断句子相似度

 

数据集介绍

 

数据集由 102477 对评论组成, label 0 代表句子不相似, 1 代表相似. 如图:

tokenize 数据 + 分割数据:

 

import numpy as np
import pandas as pd
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.utils import to_categorical
from sklearn.model_selection import train_test_split
def load_atec():
    # 读取数据
    train = pd.read_csv("data/atec/atec_nlp_sim_train.csv", sep="\t", header=None, names=['line_num', 'q1', 'q2', 'label'])
    print(train.head())
    # 读取额外数据
    train_add = pd.read_csv("data/atec/atec_nlp_sim_train_add.csv", sep="\t", header=None, names=['line_num', 'q1', 'q2', 'label'])
    print(train_add.head())
    # 拼接
    train_combine = pd.concat([train, train_add])
    print(train_combine.shape)  # (102477, 4)
    return train_combine
def tokenized_data():
    # 读取数据
    data = load_atec()
    print(data.head())
    # 空格
    data["q1"] = data["q1"].apply(lambda x:" ".join(x))
    data["q2"] = data["q2"].apply(lambda x:" ".join(x))
    # 获取X,y
    q1 = list(data["q1"].values)
    q2 = list(data["q2"].values)
    y = list(data["label"].values)
    # tokenizer
    tokenizer = Tokenizer()
    # 拟合
    tokenizer.fit_on_texts(q1 + q2)
    # 序列化
    q1_sequences = tokenizer.texts_to_sequences(q1)
    q2_sequences = tokenizer.texts_to_sequences(q2)
    # 词袋
    word_index = tokenizer.word_index
    print(len(word_index))
    print(word_index)
    # 填充序列
    q1 = pad_sequences(q1_sequences, maxlen=25)
    q2 = pad_sequences(q2_sequences, maxlen=25)
    # 标签转换成one-hot
    labels = to_categorical(np.asarray(y))
    return q1, q2, labels
def train_data():
    # 获取tokenized数据
    q1, q2, labels = tokenized_data()
    # ndarray
    q1 = np.asarray(q1)
    q2 = np.asarray(q2)
    labels = np.asarray(labels)
    # 调试输出
    print(q1[:5])
    print(q2[:5])
    print(labels[:5])
    # 分割数据集
    X1_train, X1_valid, y_train, y_valid = train_test_split(q1, labels, random_state=0)
    X2_train, X2_valid, _, _ = train_test_split(q2, labels, random_state=0)
    return X1_train, X1_valid, X2_train, X2_valid, y_train, y_valid
def test_data():
    # 获取tokenized数据
    q1, q2, labels = tokenized_data()
    # ndarray
    q1 = np.asarray(q1)
    q2 = np.asarray(q2)
    labels = np.asarray(labels)
    # 测试数据
    X1_test = q1[:5]
    X2_test = q2[:5]
    y_test = labels[:5]
    # 调试输出
    print(X1_test)
    print(X2_test)
    print(y_test)
    return X1_test, X2_test, y_test
if __name__ == '__main__':
    test_data()

 

import tensorflow as tf
from tensorflow.keras.layers import Embedding, LSTM, Bidirectional, Dense, Concatenate
from preprocess import train_data, test_data
# 定义超参数
VOCAB_SIZE = 2147 + 1
EMBEDDING_DIM = 300
batch_size = 128  # 一次训练的样本数目
iteration_num = 5  # 迭代次数
learning_rate = 0.001
optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)  # 优化器
loss = tf.losses.CategoricalCrossentropy()  # 损失
class My_Model(tf.keras.Model):
    """
    定义孪生网络
    """
    def __init__(self):
        """
        初始化
        """
        super(My_Model, self).__init__()
        # embedding
        self.embedding = Embedding(VOCAB_SIZE, EMBEDDING_DIM)
        # lstm
        self.lstm1 = Bidirectional(LSTM(128, return_sequences=True, dropout=0.5))
        self.lstm2 = Bidirectional(LSTM(32, dropout=0.5))
        # 输出
        self.concatenate = Concatenate()
        self.fc = Dense(2, activation="softmax")  # 第四层
    def call(self, inputs, training=None):
        """
        在Model被调用的时候执行
        :param inputs: 输入[第一句话, 第二句话]
        :param training: 默认为None
        :return: 返回输出
        """
        input1, input2 = inputs
        # embedding
        encoded1 = self.embedding(input1)
        encoded2 = self.embedding(input2)
        # lstm1
        out1 = self.lstm1(encoded1)
        out2 = self.lstm1(encoded2)
        # lstm2
        out1 = self.lstm2(out1)
        out2 = self.lstm2(out2)
        # 合并
        combined = self.concatenate([out1, out2])
        # 输出
        out = self.fc(combined)
        return out
def train():
    """训练"""
    # 获取数据
    X1_train, X1_valid, X2_train, X2_valid, y_train, y_valid = train_data()
    # 实例化模型
    model = My_Model()
    # 调试输出summary
    model.build(input_shape=([(25, None), (25, None)]))
    print(model.summary())
    # 组合
    model.compile(optimizer=optimizer, loss=loss, metrics=["accuracy"])
    # 保存
    checkpoint = tf.keras.callbacks.ModelCheckpoint("model/model.tf", monitor='val_accuracy',
                                                    verbose=1,
                                                    save_best_only=True,
                                                    mode='max')
    # 训练
    model.fit([X1_train, X2_train], y_train, validation_data=([X1_valid, X2_valid], y_valid), epochs=iteration_num,
              batch_size=batch_size,
              callbacks=[checkpoint])
def test():
    """测试"""
    # 读取数据
    X1_test, X2_test, y_test = test_data()
    # 读取模型
    model = tf.keras.models.load_model("model/model.tf")
    print(model.summary())
    # 预测
    y_predict = model.predict([X1_test, X2_test], batch_size=16)
    print(y_predict, len(y_predict))
if __name__ == '__main__':
    train()

 

输出结果

 

line_num               q1                              q2  label
0         1      怎幺更改花呗手机号码  我的花呗是以前的手机号码,怎幺更改成现在的支付宝的号码手机号      1
1         2  也开不了花呗,就这样了?完事了                      真的嘛?就是花呗付款      0
2         3      花呗冻结以后还能开通吗                   我的条件可以开通花呗借款吗      0
3         4         如何得知关闭借呗                         想永久关闭借呗      0
4         5           花呗扫码付钱                     二维码扫描可以用花呗吗      0
   line_num                q1                     q2  label
0         1  为何我无法申请开通花呗信用卡收款  支付宝开通信用卡花呗收款不符合条件怎幺回事      1
1         2      花呗分期付款会影响使用吗             花呗分期有什幺影响吗      0
2         3      为什幺我花呗没有临时额度          花呗没有临时额度怎幺可以负      0
3         4          能不能开花呗老兄              花呗逾期了还能开通      0
4         5        我的怎幺开通花呗收钱  这个花呗是个什幺啥?我没开通 我怎幺有账单      0
(102477, 4)
   line_num               q1                              q2  label
0         1      怎幺更改花呗手机号码  我的花呗是以前的手机号码,怎幺更改成现在的支付宝的号码手机号      1
1         2  也开不了花呗,就这样了?完事了                      真的嘛?就是花呗付款      0
2         3      花呗冻结以后还能开通吗                   我的条件可以开通花呗借款吗      0
3         4         如何得知关闭借呗                         想永久关闭借呗      0
4         5           花呗扫码付钱                     二维码扫描可以用花呗吗      0
2147
{'呗': 1, '花': 2, '幺': 3, '还': 4, '借': 5, '我': 6, '款': 7, '的': 8, '了': 9, '用': 10, '不': 11, ',': 12, '怎': 13, '吗': 14, '什': 15, '是': 16, '期': 17, '额': 18, '能': 19, '可': 20, '以': 21, '有': 22, '付': 23, '为': 24, '蚂': 25, '蚁': 26, '分': 27, '度': 28, '开': 29, '没': 30, '支': 31, '钱': 32, '一': 33, '通': 34, '个': 35, '在': 36, '宝': 37, '提': 38, '到': 39, '时': 40, '号': 41, '月': 42, '多': 43, '账': 44, '收': 45, '要': 46, '费': 47, '退': 48, '后': 49, '前': 50, '使': 51, '卡': 52, '会': 53, '手': 54, '信': 55, '里': 56, '码': 57, '现': 58, '扣': 59, '示': 60, '天': 61, '少': 62, '这': 63, '商': 64, '行': 65, '关': 66, '上': 67, '逾': 68, '动': 69, '机': 70, '显': 71, '已': 72, '如': 73, '银': 74, '单': 75, '自': 76, '请': 77, '余': 78, '息': 79, '候': 80, '次': 81, '何': 82, '买': 83, '消': 84, '下': 85, '样': 86, '申': 87, '办': 88, '想': 89, '最': 90, '清': 91, '就': 92, '闭': 93, '和': 94, '经': 95, '才': 96, '日': 97, '换': 98, '哪': 99, '过': 100, '定': 101, '都': 102, '贷': 103, '金': 104, '面': 105, '回': 106, '网': 107, '利': 108, '淘': 109, '但': 110, '低': 111, '绑': 112, '影': 113, '家': 114, '只': 115, '响': 116, '取': 117, '临': 118, '证': 119, '续': 120, '完': 121, '看': 122, '之': 123, '户': 124, '几': 125, '改': 126, '成': 127, '查': 128, '结': 129, '来': 130, '给': 131, '人': 132, '复': 133, '限': 134, '持': 135, '把': 136, '录': 137, '每': 138, '久': 139, '出': 140, '交': 141, '东': 142, '算': 143, '去': 144, '需': 145, '升': 146, '恢': 147, '西': 148, '那': 149, '再': 150, '话': 151, '冻': 152, '点': 153, '功': 154, '电': 155, '记': 156, '也': 157, '充': 158, '另': 159, '除': 160, '刚': 161, '转': 162, '别': 163, '说': 164, '法': 165, '间': 166, '两': 167, '份': 168, '。': 169, '车': 170, '全': 171, '购': 172, '帮': 173, '今': 174, '被': 175, '嘛': 176, '二': 177, '果': 178, '从': 179, '直': 180, '意': 181, '无': 182, '元': 183, '更': 184, '好': 185, '啥': 186, '高': 187, '店': 188, '新': 189, '设': 190, '找': 191, '当': 192, '事': 193, '货': 194, '置': 195, '免': 196, '?': 197, '思': 198, '解': 199, '变': 200, '身': 201, '密': 202, '明': 203, '对': 204, '降': 205, '验': 206, '未': 207, '然': 208, '否': 209, '件': 210, '积': 211, '十': 212, '登': 213, '又': 214, '进': 215, '让': 216, '你': 217, '服': 218, '包': 219, '票': 220, '帐': 221, '问': 222, '负': 223, '知': 224, '笔': 225, '本': 226, '超': 227, '扫': 228, '打': 229, '系': 230, '部': 231, '麻': 232, '短': 233, '认': 234, '欠': 235, '方': 236, '品': 237, '值': 238, '物': 239, '条': 240, '呀': 241, '外': 242, '重': 243, '调': 244, '够': 245, '选': 246, '吧': 247, '权': 248, '脸': 249, '入': 250, '长': 251, '芝': 252, '制': 253, '中': 254, '己': 255, '红': 256, '得': 257, '询': 258, '同': 259, '原': 260, '年': 261, '小': 262, '按': 263, '接': 264, '友': 265, '他': 266, '务': 267, '合': 268, '维': 269, '刷': 270, '押': 271, '发': 272, '先': 273, '掉': 274, '注': 275, '双': 276, '迟': 277, '客': 278, '道': 279, '晚': 280, '实': 281, '订': 282, '性': 283, '加': 284, '跟': 285, '删': 286, '易': 287, '足': 288, '总': 289, '三': 290, '授': 291, '因': 292, '滴': 293, '第': 294, '确': 295, '生': 296, '数': 297, '延': 298, '代': 299, '卖': 300, '主': 301, '错': 302, '失': 303, '情': 304, '醒': 305, '修': 306, '些': 307, '统': 308, '停': 309, '咋': 310, '起': 311, '险': 312, '忘': 313, '作': 314, '返': 315, '领': 316, '六': 317, '活': 318, '应': 319, '该': 320, '销': 321, '式': 322, '常': 323, '万': 324, '放': 325, '大': 326, '符': 327, '朋': 328, '与': 329, '体': 330, '评': 331, '券': 332, '微': 333, '安': 334, '线': 335, '存': 336, '其': 337, '昨': 338, '产': 339, '口': 340, '估': 341, '却': 342, '核': 343, '!': 344, '择': 345, '共': 346, '美': 347, '兑': 348, '审': 349, '百': 350, '操': 351, '于': 352, '预': 353, '块': 354, '整': 355, '们': 356, '暂': 357, '理': 358, '资': 359, '名': 360, '缴': 361, '风': 362, '抽': 363, '页': 364, '剩': 365, '团': 366, '弄': 367, '优': 368, '约': 369, '满': 370, '奖': 371, '火': 372, '正': 373, '邮': 374, '减': 375, '见': 376, '市': 377, '识': 378, '败': 379, '忙': 380, '处': 381, '继': 382, '所': 383, '业': 384, '计': 385, '况': 386, '推': 387, '题': 388, '享': 389, '比': 390, '千': 391, '率': 392, '级': 393, '铺': 394, '半': 395, 'p': 396, '子': 397, '或': 398, '学': 399, '透': 400, '而': 401, '等': 402, 'a': 403, '细': 404, '项': 405, '涨': 406, '老': 407, '联': 408, '快': 409, '首': 410, '五': 411, '啦': 412, '突': 413, '始': 414, '必': 415, '切': 416, '照': 417, '邀': 418, '贴': 419, '脑': 420, '须': 421, '做': 422, '油': 423, '猫': 424, '零': 425, '九': 426, '誉': 427, '心': 428, '贝': 429, '区': 430, '它': 431, '边': 432, '惠': 433, '历': 434, '繁': 435, '公': 436, '流': 437, '启': 438, '填': 439, '很': 440, '储': 441, '您': 442, '叫': 443, '津': 444, '讯': 445, '册': 446, '蓄': 447, '马': 448, 'q': 449, '政': 450, '陆': 451, '、': 452, '底': 453, '水': 454, '冲': 455, '永': 456, '碑': 457, '求': 458, '并': 459, '尽': 460, '将': 461, '太': 462, '量': 463, '衣': 464, '送': 465, '张': 466, '员': 467, '工': 468, '谢': 469, '受': 470, '输': 471, '封': 472, '地': 473, 's': 474, '致': 475, '营': 476, '签': 477, '者': 478, '料': 479, '内': 480, '格': 481, '向': 482, '周': 483, '拜': 484, '游': 485, '房': 486, '传': 487, '执': 488, '标': 489, '随': 490, '立': 491, '境': 492, '卷': 493, '般': 494, '顾': 495, '儿': 496, '写': 497, '且': 498, '善': 499, '具': 500, '着': 501, '差': 502, '戏': 503, '午': 504, '摩': 505, '箱': 506, 'o': 507, '酒': 508, '丢': 509, '增': 510, '租': 511, '效': 512, '抵': 513, '干': 514, '运': 515, '诉': 516, '固': 517, '试': 518, '像': 519, '早': 520, '移': 521, '拿': 522, '保': 523, '近': 524, '住': 525, '连': 526, '击': 527, '顺': 528, '呗': 529, '达': 530, '留': 531, '止': 532, '价': 533, '违': 534, '序': 535, '任': 536, '撤': 537, '带': 538, '规': 539, '摇': 540, '越': 541, '补': 542, '良': 543, '反': 544, '及': 545, '端': 546, '化': 547, '四': 548, '国': 549, '初': 550, '搞': 551, '烦': 552, '宽': 553, '履': 554, '咨': 555, '指': 556, '礼': 557, '门': 558, '管': 559, '真': 560, 'b': 561, '隐': 562, '便': 563, '目': 564, '即': 565, '界': 566, '蓝': 567, '站': 568, '励': 569, '图': 570, '藏': 571, '倍': 572, '际': 573, '农': 574, '尾': 575, '获': 576, '苹': 577, '决': 578, '种': 579, '黄': 580, '慢': 581, '币': 582, 'i': 583, '准': 584, '哈': 585, '速': 586, '场': 587, '误': 588, '盒': 589, '飞': 590, '台': 591, '导': 592, '待': 593, '益': 594, '属': 595, '访': 596, '饿': 597, '平': 598, '纳': 599, '添': 600, '字': 601, '至': 602, '旧': 603, '谁': 604, '助': 605, '相': 606, '饭': 607, '往': 608, '备': 609, '激': 610, '划': 611, '假': 612, '翻': 613, '载': 614, '专': 615, '断': 616, '白': 617, '概': 618, '走': 619, '懂': 620, '星': 621, '途': 622, '软': 623, '详': 624, '校': 625, '阿': 626, '投': 627, '京': 628, '建': 629, '…': 630, '麽': 631, '报': 632, '根': 633, '七': 634, '许': 635, '吃': 636, '急': 637, '玩': 638, '允': 639, 'e': 640, '气': 641, '售': 642, '程': 643, '节': 644, '集': 645, '占': 646, '劵': 647, '拍': 648, '版': 649, '片': 650, '则': 651, '默': 652, '八': 653, '步': 654, '邦': 655, '告': 656, '环': 657, '议': 658, '企': 659, '此': 660, '由': 661, 'n': 662, '赠': 663, '司': 664, '适': 665, '头': 666, '答': 667, '罗': 668, '强': 669, '基': 670, '社': 671, '空': 672, '截': 673, '港': 674, '描': 675, 'm': 676, '据': 677, '壳': 678, '参': 679, '锁': 680, '餐': 681, '俩': 682, '】': 683, '觉': 684, '状': 685, '替': 686, '护': 687, '坏': 688, '综': 689, '志': 690, '循': 691, '括': 692, '闲': 693, '挖': 694, '村': 695, '罚': 696, '段': 697, '键': 698, '—': 699, '鱼': 700, '感': 701, '龄': 702, '故': 703, '钟': 704, '拖': 705, '她': 706, '址': 707, '右': 708, '“': 709, 'h': 710, '批': 711, '异': 712, '挂': 713, '供': 714, '抢': 715, '【': 716, '非': 717, '位': 718, '态': 719, '仍': 720, '远': 721, '城': 722, '猪': 723, '楚': 724, '妈': 725, 'c': 726, '稍': 727, '纸': 728, 'f': 729, '禁': 730, '表': 731, '跳': 732, 'l': 733, '归': 734, '拼': 735, '读': 736, '装': 737, '窗': 738, '递': 739, '巴': 740, '质': 741, '酷': 742, '终': 743, '含': 744, '乱': 745, '香': 746, '没': 747, '纪': 748, '望': 749, '组': 750, '附': 751, '疑': 752, '控': 753, '极': 754, '1': 755, '催': 756, '印': 757, '海': 758, '咯': 759, '嘀': 760, '奇': 761, '紧': 762, '院': 763, '束': 764, '毕': 765, '协': 766, '希': 767, '左': 768, '链': 769, '毛': 770, '类': 771, '视': 772, '迹': 773, '围': 774, '拉': 775, '乐': 776, '听': 777, '若': 778, '范': 779, '牌': 780, '医': 781, '路': 782, '凭': 783, 'u': 784, 't': 785, '广': 786, '史': 787, '彻': 788, '依': 789, '莫': 790, '官': 791, '色': 792, '”': 793, '石': 794, '书': 795, 'v': 796, '庆': 797, '教': 798, '缺': 799, ':': 800, '荐': 801, '偿': 802, '挺': 803, '缓': 804, '难': 805, '缘': 806, 'k': 807, '黑': 808, '特': 809, 'd': 810, '幺': 811, '虚': 812, '容': 813, '末': 814, '灰': 815, '王': 816, '互': 817, '普': 818, '独': 819, '拟': 820, '频': 821, '蜜': 822, '赚': 823, '爱': 824, '拥': 825, '民': 826, '食': 827, '福': 828, '宜': 829, '澳': 830, 'x': 831, '造': 832, '较': 833, '弹': 834, '遇': 835, '景': 836, '累': 837, '刻': 838, '叠': 839, '忽': 840, '华': 841, '馆': 842, '唯': 843, '光': 844, '坐': 845, '财': 846, '术': 847, '宁': 848, '折': 849, '络': 850, '障': 851, '春': 852, '欢': 853, '捡': 854, 'y': 855, '套': 856, '隔': 857, '径': 858, '鬼': 859, '苏': 860, '喜': 861, '章': 862, '怕': 863, '力': 864, '承': 865, '吗': 866, '杂': 867, '~': 868, '招': 869, '死': 870, '撒': 871, '寄': 872, '吖': 873, '卸': 874, '担': 875, '鞋': 876, '缩': 877, 'w': 878, 'r': 879, '骑': 880, '煤': 881, '骗': 882, '艺': 883, '刮': 884, '融': 885, "'": 886, '拒': 887, '展': 888, '栏': 889, '匙': 890, '5': 891, '义': 892, '暖': 893, '润': 894, '省': 895, '旅': 896, '文': 897, '器': 898, '例': 899, '钥': 900, '捆': 901, '凌': 902, '乘': 903, '晨': 904, '咱': 905, '肯': 906, '尔': 907, '玛': 908, '偷': 909, '压': 910, '林': 911, '债': 912, '检': 913, '荣': 914, '岁': 915, ')': 916, '形': 917, '伸': 918, '倒': 919, '喽': 920, '姐': 921, '曰': 922, '略': 923, '纹': 924, '森': 925, '绝': 926, '耀': 927, '某': 928, '尝': 929, 'g': 930, '角': 931, '列': 932, '各': 933, '讲': 934, '(': 935, '赔': 936, '居': 937, '热': 938, '渠': 939, '测': 940, '米': 941, '型': 942, '额': 943, '洗': 944, '3': 945, '介': 946, '板': 947, '神': 948, '麦': 949, '令': 950, '搜': 951, '德': 952, '宾': 953, '既': 954, '股': 955, '辆': 956, '呐': 957, '钮': 958, '汽': 959, '彩': 960, '膜': 961, '严': 962, '秒': 963, '菜': 964, '危': 965, '释': 966, '构': 967, '妙': 968, '害': 969, '顶': 970, '捷': 971, '屏': 972, '坝': 973, '愈': 974, '燃': 975, '木': 976, '9': 977, '8': 978, '语': 979, '携': 980, '齐': 981, '象': 982, '休': 983, '追': 984, '混': 985, '夜': 986, '戒': 987, 'z': 988, '判': 989, '沃': 990, '佣': 991, '喔': 992, '骤': 993, '函': 994, '赶': 995, '音': 996, '圈': 997, '盗': 998, '考': 999, '劳': 1000, '裤': 1001, '贵': 1002, '州': 1003, '守': 1004, '嘞': 1005, '坑': 1006, '绍': 1007, '药': 1008, '称': 1009, '秘': 1010, '病': 1011, '汇': 1012, '域': 1013, '遍': 1014, '垫': 1015, '绿': 1016, '亮': 1017, '配': 1018, '呵': 1019, '铁': 1020, '靠': 1021, '势': 1022, '论': 1023, '俞': 1024, '南': 1025, '嚒': 1026, '盖': 1027, '敢': 1028, '堤': 1029, '举': 1030, '钻': 1031, '饲': 1032, '2': 1033, '0': 1034, '聊': 1035, '斯': 1036, '跨': 1037, '索': 1038, '深': 1039, '%': 1040, '跑': 1041, '聚': 1042, '蘑': 1043, '菇': 1044, '街': 1045, '案': 1046, '梦': 1047, '女': 1048, '滞': 1049, '冰': 1050, '竟': 1051, '还': 1052, '触': 1053, '厅': 1054, '副': 1055, '智': 1056, '托': 1057, '采': 1058, '为': 1059, '烟': 1060, '揭': 1061, '侯': 1062, '喃': 1063, '开': 1064, '欺': 1065, '巳': 1066, '佳': 1067, '袋': 1068, '怀': 1069, '婆': 1070, '众': 1071, '喻': 1072, '7': 1073, '损': 1074, '模': 1075, '旗': 1076, '仅': 1077, '卓': 1078, '晕': 1079, '排': 1080, 'j': 1081, '唤': 1082, '咸': 1083, '摊': 1084, '责': 1085, '离': 1086, '乡': 1087, '馈': 1088, '抠': 1089, '怪': 1090, '愿': 1091, '跃': 1092, '铲': 1093, '姓': 1094, '晰': 1095, '勒': 1096, '似': 1097, '亚': 1098, '龙': 1099, '哥': 1100, '曾': 1101, '园': 1102, '私': 1103, '富': 1104, '废': 1105, '辉': 1106, '江': 1107, '背': 1108, '妹': 1109, '爸': 1110, '泰': 1111, '斥': 1112, '困': 1113, '4': 1114, '航': 1115, '·': 1116, '材': 1117, '弟': 1118, '锅': 1119, '粉': 1120, '尼': 1121, '征': 1122, '局': 1123, '画': 1124, ';': 1125, '税': 1126, '.': 1127, '孩': 1128, '拓': 1129, '甚': 1130, '悦': 1131, '养': 1132, '6': 1133, '球': 1134, '喊': 1135, '赢': 1136, '救': 1137, '寻': 1138, '哇': 1139, '弃': 1140, '脉': 1141, '庄': 1142, '殊': 1143, '蚱': 1144, '吹': 1145, '赁': 1146, '县': 1147, '咖': 1148, '患': 1149, '柜': 1150, '策': 1151, '掏': 1152, '士': 1153, '声': 1154, '摄': 1155, '恶': 1156, '悔': 1157, '勾': 1158, '虽': 1159, '遗': 1160, '源': 1161, '旦': 1162, '迪': 1163, '啤': 1164, '稳': 1165, '均': 1166, '佰': 1167, '滚': 1168, '乎': 1169, '狗': 1170, '洁': 1171, '讨': 1172, '偶': 1173, '涵': 1174, '鸡': 1175, '甘': 1176, '冷': 1177, '丫': 1178, '北': 1179, '咧': 1180, '浦': 1181, '牢': 1182, '厂': 1183, '闷': 1184, '阵': 1185, '世': 1186, '扰': 1187, '桌': 1188, '岀': 1189, '谓': 1190, '凑': 1191, '陌': 1192, '劲': 1193, '克': 1194, '引': 1195, '毁': 1196, '逼': 1197, '蚊': 1198, '辨': 1199, '尚': 1200, '耍': 1201, '仟': 1202, '廷': 1203, '眼': 1204, '技': 1205, '涮': 1206, '韩': 1207, '滑': 1208, '搭': 1209, '⊙': 1210, '喝': 1211, '幅': 1212, '宿': 1213, '男': 1214, '圣': 1215, '诞': 1216, '腿': 1217, '歌': 1218, '蔽': 1219, '析': 1220, '肃': 1221, '究': 1222, '弊': 1223, '珠': 1224, '庭': 1225, '佘': 1226, '腾': 1227, '饮': 1228, '耽': 1229, '拾': 1230, '舰': 1231, '铂': 1232, '毒': 1233, '简': 1234, '亏': 1235, '逸': 1236, '郁': 1237, '蛋': 1238, '温': 1239, '旺': 1240, '《': 1241, '蛮': 1242, '圆': 1243, '晓': 1244, '丢': 1245, '茶': 1246, '瑜': 1247, '队': 1248, '攒': 1249, '邻': 1250, '奥': 1251, '卫': 1252, '素': 1253, '闪': 1254, '丰': 1255, '逐': 1256, '阅': 1257, '骂': 1258, '锤': 1259, '惜': 1260, '挑': 1261, '念': 1262, '牙': 1263, '破': 1264, '码': 1265, '逊': 1266, '丝': 1267, '晶': 1268, '时': 1269, '武': 1270, '汉': 1271, '健': 1272, '问': 1273, '挣': 1274, '耶': 1275, '莪': 1276, '贩': 1277, '河': 1278, '烈': 1279, '奶': 1280, '陪': 1281, '攻': 1282, '羊': 1283, '创': 1284, '础': 1285, '豆': 1286, '律': 1287, '厌': 1288, '祥': 1289, '鼓': 1290, '血': 1291, '苦': 1292, '枪': 1293, '句': 1294, '轮': 1295, '挪': 1296, '跪': 1297, '课': 1298, '炒': 1299, '》': 1300, '逛': 1301, '群': 1302, '嗨': 1303, '陶': 1304, '康': 1305, '皮': 1306, '施': 1307, '倩': 1308, '叶': 1309, '济': 1310, '圳': 1311, '露': 1312, '央': 1313, '请': 1314, '迅': 1315, '蚂': 1316, '蚁': 1317, '傅': 1318, '魅': 1319, '族': 1320, '察': 1321, '班': 1322, '盛': 1323, '胜': 1324, '欧': 1325, '述': 1326, '师': 1327, '眨': 1328, '镜': 1329, '育': 1330, '狂': 1331, '框': 1332, '娱': 1333, '个': 1334, '谈': 1335, '沟': 1336, '甲': 1337, '针': 1338, '粒': 1339, '籍': 1340, '山': 1341, '闻': 1342, '惩': 1343, '迁': 1344, '痛': 1345, '青': 1346, '肿': 1347, '赖': 1348, '兴': 1349, '草': 1350, '布': 1351, '架': 1352, '杰': 1353, '徽': 1354, '耗': 1355, '虎': 1356, '宝': 1357, '垃': 1358, '圾': 1359, '捐': 1360, '鸟': 1361, '亡': 1362, '座': 1363, '吵': 1364, '仪': 1365, '赏': 1366, '勇': 1367, '唱': 1368, '☆': 1369, '沙': 1370, '援': 1371, '萌': 1372, '诚': 1373, '予': 1374, '赞': 1375, '战': 1376, '亿': 1377, '辛': 1378, '杀': 1379, '哩': 1380, '糕': 1381, '挨': 1382, '仙': 1383, '渝': 1384, '泥': 1385, '距': 1386, '习': 1387, '惯': 1388, '云': 1389, '貌': 1390, '湾': 1391, '扯': 1392, '措': 1393, '杭': 1394, '漏': 1395, '避': 1396, '波': 1397, '糯': 1398, '俄': 1399, '昌': 1400, '涉': 1401, '散': 1402, '洞': 1403, '室': 1404, '嫩': 1405, '証': 1406, '洋': 1407, '杯': 1408, '岂': 1409, '歉': 1410, '李': 1411, '帐': 1412, '拆': 1413, '言': 1414, '臂': 1415, '绑': 1416, '扔': 1417, '驻': 1418, '湖': 1419, '棒': 1420, '猜': 1421, '∩': 1422, '吋': 1423, '踢': 1424, '别': 1425, '裹': 1426, '味': 1427, '粮': 1428, '辈': 1429, '疆': 1430, '恭': 1431, '银': 1432, '俺': 1433, '洲': 1434, '凡': 1435, '夫': 1436, '啧': 1437, '胀': 1438, '盆': 1439, '灯': 1440, '肤': 1441, '夏': 1442, '鸣': 1443, '宗': 1444, '坚': 1445, '派': 1446, '冒': 1447, '仔': 1448, '惑': 1449, '摸': 1450, '蜂': 1451, '钱': 1452, '吓': 1453, '挽': 1454, '虑': 1455, '×': 1456, '屋': 1457, '≥': 1458, '挷': 1459, '撑': 1460, '昵': 1461, '辞': 1462, '灵': 1463, '疗': 1464, '吊': 1465, '厉': 1466, '冯': 1467, '尴': 1468, '尬': 1469, '袜': 1470, '杳': 1471, '旬': 1472, '屈': 1473, '臣': 1474, '氏': 1475, '纷': 1476, '鲜': 1477, '覆': 1478, '浪': 1479, '瞬': 1480, '精': 1481, '瓜': 1482, '笑': 1483, '母': 1484, '裙': 1485, '职': 1486, '费': 1487, '军': 1488, '魔': 1489, 'p': 1490, '\ufeff': 1491, '缸': 1492, '伦': 1493, '浆': 1494, '炸': 1495, '欲': 1496, '恼': 1497, '颗': 1498, '雨': 1499, '咬': 1500, '盼': 1501, '诺': 1502, '赋': 1503, '丶': 1504, '盟': 1505, '剑': 1506, '糊': 1507, '涂': 1508, '驾': 1509, '厚': 1510, '牛': 1511, '‘': 1512, '雷': 1513, '霆': 1514, '恁': 1515, '贡': 1516, '伽': 1517, '颜': 1518, '鉴': 1519, '爆': 1520, '监': 1521, '呜': 1522, '牵': 1523, '曼': 1524, '贷': 1525, '莲': 1526, '童': 1527, '咔': 1528, '洛': 1529, '赌': 1530, '博': 1531, '溢': 1532, '减': 1533, '两': 1534, '驳': 1535, '嗷': 1536, '弥': 1537, '秀': 1538, '磨': 1539, '幕': 1540, '疯': 1541, '怅': 1542, '吸': 1543, '命': 1544, '迫': 1545, '购': 1546, '逗': 1547, '兄': 1548, '绷': 1549, '罢': 1550, '〔': 1551, '〕': 1552, '囗': 1553, '宵': 1554, '哭': 1555, '咩': 1556, '努': 1557, '幻': 1558, '脱': 1559, '钩': 1560, '纯': 1561, '桃': 1562, '丹': 1563, '液': 1564, '収': 1565, '映': 1566, '壁': 1567, '培': 1568, '潜': 1569, '丽': 1570, '谱': 1571, '碍': 1572, '吉': 1573, '厘': 1574, '驶': 1575, '给': 1576, '眷': 1577, '粑': 1578, '矿': 1579, '锦': 1580, '掌': 1581, '迷': 1582, '横': 1583, '呦': 1584, '胡': 1585, '―': 1586, '岛': 1587, '贼': 1588, '刚': 1589, '忠': 1590, '湾': 1591, '乍': 1592, '伤': 1593, '乙': 1594, '叭': 1595, '禄': 1596, '啷': 1597, '骚': 1598, '临': 1599, '\u3000': 1600, '搁': 1601, '◎': 1602, '迈': 1603, '梆': 1604, '匹': 1605, '衫': 1606, '衡': 1607, '辜': 1608, '凊': 1609, '坡': 1610, '妆': 1611, '库': 1612, '扩': 1613, '楼': 1614, '瞒': 1615, '红': 1616, '辣': 1617, '惊': 1618, '肥': 1619, '鸭': 1620, '巾': 1621, '鲁': 1622, '幺': 1623, '剪': 1624, '伙': 1625, '兵': 1626, '栋': 1627, '土': 1628, '饰': 1629, '桂': 1630, '姨': 1631, '穷': 1632, '摆': 1633, '蒋': 1634, '歪': 1635, '贺': 1636, '阳': 1637, '父': 1638, '屁': 1639, '瓶': 1640, '肖': 1641, '"': 1642, '英': 1643, '静': 1644, '懒': 1645, '玉': 1646, '兰': 1647, '+': 1648, '夸': 1649, '跌': 1650, '旁': 1651, ' ̄': 1652, '睡': 1653, '割': 1654, '媛': 1655, '悄': 1656, '净': 1657, '吱': 1658, '促': 1659, '峰': 1660, '贝': 1661, '贱': 1662, '擅': 1663, '尿': 1664, '趣': 1665, '哒': 1666, '虹': 1667, '夕': 1668, '哼': 1669, '浴': 1670, '抚': 1671, '防': 1672, '胃': 1673, '宴': 1674, '叻': 1675, '囙': 1676, '钓': 1677, '妇': 1678, '啡': 1679, '糟': 1680, '凤': 1681, '宣': 1682, '撩': 1683, '衰': 1684, '荆': 1685, '趸': 1686, '泳': 1687, '呮': 1688, '砸': 1689, '屎': 1690, '扎': 1691, '灶': 1692, '丁': 1693, '雪': 1694, '膏': 1695, '暴': 1696, '啲': 1697, '屡': 1698, '吻': 1699, '穿': 1700, '郎': 1701, '説': 1702, '钢': 1703, '伊': 1704, '鼻': 1705, '抗': 1706, '叩': 1707, '袖': 1708, '匿': 1709, '执': 1710, '簇': 1711, '舒': 1712, '弘': 1713, '∽': 1714, '来': 1715, '猛': 1716, '匆': 1717, '壮': 1718, '戚': 1719, '墨': 1720, '届': 1721, '爷': 1722, '无': 1723, '乳': 1724, '负': 1725, '轻': 1726, '瞪': 1727, '査': 1728, '寒': 1729, '贯': 1730, '祝': 1731, '伲': 1732, '扭': 1733, '舍': 1734, '[': 1735, ']': 1736, '玏': 1737, '爽': 1738, '杞': 1739, '罚': 1740, '规': 1741, '则': 1742, '脆': 1743, '宫': 1744, '崇': 1745, '档': 1746, '嫂': 1747, '评': 1748, '睌': 1749, '贸': 1750, '谝': 1751, '亊': 1752, '碌': 1753, '敬': 1754, '羽': 1755, '绒': 1756, '弑': 1757, '慧': 1758, '朽': 1759, '浮': 1760, '筘': 1761, '抡': 1762, '唔': 1763, '卅': 1764, '罐': 1765, '辟': 1766, '踪': 1767, '忍': 1768, '训': 1769, '虫': 1770, '帝': 1771, '徐': 1772, '鹰': 1773, '摁': 1774, '硕': 1775, '妨': 1776, '妃': 1777, '塞': 1778, '结': 1779, '阪': 1780, '躲': 1781, '=': 1782, '∨': 1783, '譬': 1784, '撸': 1785, '抛': 1786, '踩': 1787, '蕾': 1788, '松': 1789, '虾': 1790, '浙': 1791, '刀': 1792, '伎': 1793, '拘': 1794, '说': 1795, '陷': 1796, '歆': 1797, '肔': 1798, '绊': 1799, '糸': 1800, '盘': 1801, '绪': 1802, '拱': 1803, '祢': 1804, '兆': 1805, '傲': 1806, '莉': 1807, '鼠': 1808, '捕': 1809, '蹲': 1810, '媒': 1811, '镇': 1812, '轲': 1813, '伶': 1814, '佝': 1815, '捉': 1816, '鍀': 1817, '①': 1818, '腨': 1819, '戗': 1820, '抓': 1821, '植': 1822, '拦': 1823, '螺': 1824, '蛳': 1825, '肆': 1826, '禾': 1827, '鈤': 1828, '惹': 1829, '机': 1830, '\': 1831, '/': 1832, '颃': 1833, '纬': 1834, '纱': 1835, '莞': 1836, '蝙': 1837, '蝠': 1838, '艹': 1839, '犹': 1840, '琪': 1841, '疼': 1842, '换': 1843, '畔': 1844, '田': 1845, '勿': 1846, '衬': 1847, '肉': 1848, '赎': 1849, '佩': 1850, '权': 1851, '现': 1852, '湘': 1853, '啮': 1854, '痒': 1855, '买': 1856, '腐': 1857, '抄': 1858, '戟': 1859, '斗': 1860, '辩': 1861, '伏': 1862, '昰': 1863, '糖': 1864, '巢': 1865, '阴': 1866, '魂': 1867, '笼': 1868, '编': 1869, '威': 1870, '浓': 1871, '笫': 1872, '霉': 1873, '矛': 1874, '盾': 1875, '泸': 1876, '梓': 1877, '溪': 1878, '皇': 1879, '丈': 1880, '车': 1881, '调': 1882, '荒': 1883, '科': 1884, '裁': 1885, '餮': 1886, '粘': 1887, '怩': 1888, '篮': 1889, '拨': 1890, '脖': 1891, '翔': 1892, '燕': 1893, '湿': 1894, '榨': 1895, '汁': 1896, '歧': 1897, '经': 1898, '货': 1899, '饯': 1900, '♂': 1901, '臭': 1902, '竖': 1903, '碰': 1904, '柠': 1905, '檬': 1906, '坯': 1907, '耳': 1908, '烤': 1909, '泄': 1910, '抹': 1911, '贞': 1912, '镸': 1913, '乛': 1914, '堂': 1915, '慎': 1916, '吾': 1917, '飘': 1918, '′': 1919, '帜': 1920, '酱': 1921, '叮': 1922, '栅': 1923, '噶': 1924, '崴': 1925, '阁': 1926, '验': 1927, '证': 1928, '搬': 1929, 'ㄥ': 1930, '埠': 1931, '熊': 1932, '┃': 1933, '孒': 1934, '欹': 1935, '甜': 1936, '鹅': 1937, '娘': 1938, '喀': 1939, '夂': 1940, '泽': 1941, '∵': 1942, '矩': 1943, '冋': 1944, '柳': 1945, '兜': 1946, '珐': 1947, '氓': 1948, '栓': 1949, '溜': 1950, '恐': 1951, '牫': 1952, '叹': 1953, '播': 1954, '蜀': 1955, '磕': 1956, '√': 1957, '弍': 1958, '演': 1959, '警': 1960, '淸': 1961, '争': 1962, '电': 1963, '抬': 1964, '荔': 1965, '枝': 1966, '献': 1967, '窃': 1968, '杠': 1969, '汕': 1970, '彼': 1971, '岸': 1972, '壹': 1973, '颌': 1974, '傣': 1975, '弱': 1976, '苑': 1977, '仓': 1978, '谅': 1979, '柔': 1980, '亨': 1981, '树': 1982, '顿': 1983, '榜': 1984, '凯': 1985, '玲': 1986, '嗦': 1987, '阻': 1988, '杜': 1989, '崔': 1990, '扑': 1991, '卜': 1992, '悬': 1993, '柬': 1994, '埔': 1995, '寨': 1996, '稀': 1997, '敌': 1998, '嫁': 1999, '丕': 2000, '筠': 2001, '诊': 2002, '阖': 2003, '哆': 2004, '姑': 2005, '洼': 2006, '怼': 2007, '呼': 2008, '琢': 2009, '渤': 2010, '剐': 2011, '抱': 2012, '气': 2013, '睛': 2014, '靓': 2015, '样': 2016, '镀': 2017, 'ⅴ': 2018, '瞎': 2019, '蝼': 2020, '侍': 2021, '泪': 2022, '幸': 2023, '讠': 2024, '伴': 2025, '扥': 2026, '寿': 2027, '∠': 2028, '※': 2029, '纠': 2030, '秦': 2031, '恒': 2032, '嘟': 2033, '渐': 2034, '殖': 2035, '拣': 2036, '婴': 2037, '熟': 2038, '娜': 2039, '捞': 2040, '迟': 2041, '琴': 2042, '珊': 2043, '-': 2044, '户': 2045, '昱': 2046, '咪': 2047, '甬': 2048, '阶': 2049, '辰': 2050, '绩': 2051, '螚': 2052, '喵': 2053, '愉': 2054, '缔': 2055, '呸': 2056, '败': 2057, '练': 2058, '嫌': 2059, '督': 2060, 'a': 2061, '刭': 2062, '嗳': 2063, '鹿': 2064, '胆': 2065, '焦': 2066, '郑': 2067, '慨': 2068, '蔡': 2069, '倡': 2070, '呈': 2071, '阔': 2072, '够': 2073, '甪': 2074, '洪': 2075, '隆': 2076, '缴': 2077, '墙': 2078, '琐': 2079, '拳': 2080, '脚': 2081, '棉': 2082, '啵': 2083, '堡': 2084, '胞': 2085, '巧': 2086, '粤': 2087, '浏': 2088, '览': 2089, '绐': 2090, '菅': 2091, '粗': 2092, '孕': 2093, '渣': 2094, '番': 2095, '瞳': 2096, '睬': 2097, '茨': 2098, '厦': 2099, '伍': 2100, '陇': 2101, '讷': 2102, '〈': 2103, '盐': 2104, '挤': 2105, '盲': 2106, '古': 2107, '幼': 2108, '柱': 2109, '奈': 2110, '槛': 2111, '堆': 2112, '搂': 2113, '皆': 2114, '耐': 2115, '茌': 2116, '乃': 2117, '泝': 2118, '扛': 2119, '酬': 2120, '帽': 2121, '错': 2122, '吐': 2123, '扮': 2124, '幵': 2125, '瑟': 2126, '捏': 2127, '揍': 2128, '闹': 2129, '聪': 2130, '叧': 2131, '冬': 2132, '设': 2133, '绳': 2134, '雅': 2135, '删': 2136, '剁': 2137, '尺': 2138, '寸': 2139, '徣': 2140, '叨': 2141, '骆': 2142, '驼': 2143, '毎': 2144, '醉': 2145, '剧': 2146, '毙': 2147}
[[   0    0    0    0    0    0    0    0    0    0    0    0    0    0
  1491   13    3  184  126    2    1   54   70   41   57]
 [   0    0    0    0    0    0    0    0    0    0  157   29   11    9
     2    1   12   92   63   86    9  197  121  193    9]
 [   0    0    0    0    0    0    0    0    0    0    0    0    0    0
     2    1  152  129   21   49    4   19   29   34   14]
 [   0    0    0    0    0    0    0    0    0    0    0    0    0    0
     0    0    0   73   82  257  224   66   93    5    1]
 [   0    0    0    0    0    0    0    0    0    0    0    0    0    0
     0    0    0    0    0    2    1  228   57   23   32]]
[[ 21  50   8  54  70  41  57  12  13   3 184 126 127  58  36   8  31  23
   37   8  41  57  54  70  41]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 560   8 176
  197  92  16   2   1  23   7]
 [  0   0   0   0   0   0   0   0   0   0   0   0   6   8 240 210  20  21
   29  34   2   1   5   7  14]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
   89 456 139  66  93   5   1]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0 177 269  57 228
  675  20  21  10   2   1  14]]
[[0. 1.]
 [1. 0.]
 [1. 0.]
 [1. 0.]
 [1. 0.]]
Model: "my__model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding (Embedding)        multiple                  644400    
_________________________________________________________________
bidirectional (Bidirectional multiple                  439296    
_________________________________________________________________
bidirectional_1 (Bidirection multiple                  73984     
_________________________________________________________________
concatenate (Concatenate)    multiple                  0         
_________________________________________________________________
dense (Dense)                multiple                  258       
=================================================================
Total params: 1,157,938
Trainable params: 1,157,938
Non-trainable params: 0
_________________________________________________________________
None
Epoch 1/5
601/601 [==============================] - 286s 462ms/step - loss: 0.4753 - accuracy: 0.8141 - val_loss: 0.4591 - val_accuracy: 0.8163
Epoch 00001: val_accuracy improved from -inf to 0.81632, saving model to model\model.tf
Epoch 2/5
601/601 [==============================] - 332s 552ms/step - loss: 0.4548 - accuracy: 0.8162 - val_loss: 0.4557 - val_accuracy: 0.8161
Epoch 00002: val_accuracy did not improve from 0.81632
Epoch 3/5
601/601 [==============================] - 328s 546ms/step - loss: 0.4434 - accuracy: 0.8191 - val_loss: 0.4549 - val_accuracy: 0.8167
Epoch 00003: val_accuracy improved from 0.81632 to 0.81671, saving model to model\model.tf

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注