UnicodeEncode

clase final pública UnicodeEncode

Codifica un tensor de enteros en cadenas Unicode.

Devuelve un vector de cadenas, donde `output[i]` se construye codificando los puntos de código Unicode en `input_values[input_splits[i]:input_splits[i+1]]` usando `output_encoding`.

---

Ejemplo:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Clases anidadas

clase UnicodeEncode.Opciones Atributos opcionales para UnicodeEncode

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

Salida <TString>
como salida ()
Devuelve el identificador simbólico del tensor.
UnicodeEncode estático
crear ( alcance alcance, Operando < TInt32 > inputValues, Operando <? extiende TNumber > inputSplits, Cadena de salidaCodificación, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UnicodeEncode.
UnicodeEncode.Options estático
errores (errores de cadena)
Salida <TString>
producción ()
El tensor 1-D de cadenas codificadas a partir de los puntos de código Unicode proporcionados.
UnicodeEncode.Options estático
replacementChar (reemplazo largo Char)

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "UnicodeEncode"

Métodos públicos

Salida pública <TString> asOutput ()

Devuelve el identificador simbólico del tensor.

Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.

creación pública estática de UnicodeEncode ( alcance del alcance, operando <TInt32> valores de entrada, operando <? extiende TNumber > inputSplits, cadena de codificación de salida, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación UnicodeEncode.

Parámetros
alcance alcance actual
valores de entrada Un tensor 1D que contiene los puntos de código Unicode que deben codificarse.
entradaDivisiones Un tensor 1D que especifica cómo se deben dividir los puntos de código Unicode en cadenas. En particular, `output[i]` se construye codificando los puntos de código en el segmento `input_values[input_splits[i]:input_splits[i+1]]`.
salidaCodificación Codificación Unicode de las cadenas de salida. Las codificaciones válidas son: `"UTF-8", "UTF-16-BE" y "UTF-32-BE"`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UnicodeEncode

Errores públicos estáticos UnicodeEncode.Options (errores de cadena)

Parámetros
errores Política de manejo de errores cuando se encuentra un formato no válido en la entrada. El valor de 'estricto' hará que la operación produzca un error InvalidArgument en cualquier formato de entrada no válido. Un valor de 'reemplazar' (el valor predeterminado) hará que la operación reemplace cualquier formato no válido en la entrada con el punto de código `replacement_char`. Un valor de 'ignorar' hará que la operación omita cualquier formato no válido en la entrada y no produzca ningún carácter de salida correspondiente.

Salida pública <TString> salida ()

El tensor 1-D de cadenas codificadas a partir de los puntos de código Unicode proporcionados.

UnicodeEncode.Options estático público replacementChar (Reemplazo largo Char)

Parámetros
reemplazoChar El punto de código del carácter de reemplazo que se utilizará en lugar de cualquier formato no válido en la entrada cuando `errors='replace'`. Se puede utilizar cualquier punto de código Unicode válido. El valor predeterminado es que el carácter de reemplazo Unicode predeterminado es 0xFFFD (U+65533).