mirror of https://github.com/goccy/go-json.git
Merge pull request #70 from goccy/feature/refactor-buffering
Significantly improve encoding performance
This commit is contained in:
commit
e6dce23cb8
184
encode.go
184
encode.go
|
@ -16,6 +16,7 @@ import (
|
||||||
// An Encoder writes JSON values to an output stream.
|
// An Encoder writes JSON values to an output stream.
|
||||||
type Encoder struct {
|
type Encoder struct {
|
||||||
w io.Writer
|
w io.Writer
|
||||||
|
ctx *encodeRuntimeContext
|
||||||
buf []byte
|
buf []byte
|
||||||
enabledIndent bool
|
enabledIndent bool
|
||||||
enabledHTMLEscape bool
|
enabledHTMLEscape bool
|
||||||
|
@ -37,7 +38,7 @@ const (
|
||||||
type opcodeSet struct {
|
type opcodeSet struct {
|
||||||
codeIndent *opcode
|
codeIndent *opcode
|
||||||
code *opcode
|
code *opcode
|
||||||
ctx sync.Pool
|
codeLength int
|
||||||
}
|
}
|
||||||
|
|
||||||
func loadOpcodeMap() map[uintptr]*opcodeSet {
|
func loadOpcodeMap() map[uintptr]*opcodeSet {
|
||||||
|
@ -68,6 +69,10 @@ func init() {
|
||||||
encPool = sync.Pool{
|
encPool = sync.Pool{
|
||||||
New: func() interface{} {
|
New: func() interface{} {
|
||||||
return &Encoder{
|
return &Encoder{
|
||||||
|
ctx: &encodeRuntimeContext{
|
||||||
|
ptrs: make([]uintptr, 128),
|
||||||
|
keepRefs: make([]unsafe.Pointer, 0, 8),
|
||||||
|
},
|
||||||
buf: make([]byte, 0, bufSize),
|
buf: make([]byte, 0, bufSize),
|
||||||
structTypeToCompiledCode: map[uintptr]*compiledCode{},
|
structTypeToCompiledCode: map[uintptr]*compiledCode{},
|
||||||
structTypeToCompiledIndentCode: map[uintptr]*compiledCode{},
|
structTypeToCompiledIndentCode: map[uintptr]*compiledCode{},
|
||||||
|
@ -100,7 +105,8 @@ func (e *Encoder) EncodeWithOption(v interface{}, opts ...EncodeOption) error {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
if err := e.encode(v); err != nil {
|
var err error
|
||||||
|
if e.buf, err = e.encode(v); err != nil {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
if e.enabledIndent {
|
if e.enabledIndent {
|
||||||
|
@ -149,7 +155,8 @@ func (e *Encoder) reset() {
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeForMarshal(v interface{}) ([]byte, error) {
|
func (e *Encoder) encodeForMarshal(v interface{}) ([]byte, error) {
|
||||||
if err := e.encode(v); err != nil {
|
var err error
|
||||||
|
if e.buf, err = e.encode(v); err != nil {
|
||||||
return nil, err
|
return nil, err
|
||||||
}
|
}
|
||||||
if e.enabledIndent {
|
if e.enabledIndent {
|
||||||
|
@ -162,15 +169,16 @@ func (e *Encoder) encodeForMarshal(v interface{}) ([]byte, error) {
|
||||||
return copied, nil
|
return copied, nil
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encode(v interface{}) error {
|
func (e *Encoder) encode(v interface{}) ([]byte, error) {
|
||||||
|
b := e.buf
|
||||||
if v == nil {
|
if v == nil {
|
||||||
e.encodeNull()
|
b = encodeNull(b)
|
||||||
if e.enabledIndent {
|
if e.enabledIndent {
|
||||||
e.encodeBytes([]byte{',', '\n'})
|
b = encodeIndentComma(b)
|
||||||
} else {
|
} else {
|
||||||
e.encodeByte(',')
|
b = encodeComma(b)
|
||||||
}
|
}
|
||||||
return nil
|
return b, nil
|
||||||
}
|
}
|
||||||
header := (*interfaceHeader)(unsafe.Pointer(&v))
|
header := (*interfaceHeader)(unsafe.Pointer(&v))
|
||||||
typ := header.typ
|
typ := header.typ
|
||||||
|
@ -184,12 +192,10 @@ func (e *Encoder) encode(v interface{}) error {
|
||||||
} else {
|
} else {
|
||||||
code = codeSet.code
|
code = codeSet.code
|
||||||
}
|
}
|
||||||
ctx := codeSet.ctx.Get().(*encodeRuntimeContext)
|
ctx := e.ctx
|
||||||
p := uintptr(header.ptr)
|
p := uintptr(header.ptr)
|
||||||
ctx.init(p)
|
ctx.init(p, codeSet.codeLength)
|
||||||
err := e.run(ctx, code)
|
return e.run(ctx, b, code)
|
||||||
codeSet.ctx.Put(ctx)
|
|
||||||
return err
|
|
||||||
}
|
}
|
||||||
|
|
||||||
// noescape trick for header.typ ( reflect.*rtype )
|
// noescape trick for header.typ ( reflect.*rtype )
|
||||||
|
@ -201,7 +207,7 @@ func (e *Encoder) encode(v interface{}) error {
|
||||||
withIndent: true,
|
withIndent: true,
|
||||||
})
|
})
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return err
|
return nil, err
|
||||||
}
|
}
|
||||||
code, err := e.compileHead(&encodeCompileContext{
|
code, err := e.compileHead(&encodeCompileContext{
|
||||||
typ: copiedType,
|
typ: copiedType,
|
||||||
|
@ -209,7 +215,7 @@ func (e *Encoder) encode(v interface{}) error {
|
||||||
withIndent: false,
|
withIndent: false,
|
||||||
})
|
})
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return err
|
return nil, err
|
||||||
}
|
}
|
||||||
codeIndent = copyOpcode(codeIndent)
|
codeIndent = copyOpcode(codeIndent)
|
||||||
code = copyOpcode(code)
|
code = copyOpcode(code)
|
||||||
|
@ -217,20 +223,13 @@ func (e *Encoder) encode(v interface{}) error {
|
||||||
codeSet := &opcodeSet{
|
codeSet := &opcodeSet{
|
||||||
codeIndent: codeIndent,
|
codeIndent: codeIndent,
|
||||||
code: code,
|
code: code,
|
||||||
ctx: sync.Pool{
|
codeLength: codeLength,
|
||||||
New: func() interface{} {
|
|
||||||
return &encodeRuntimeContext{
|
|
||||||
ptrs: make([]uintptr, codeLength),
|
|
||||||
keepRefs: make([]unsafe.Pointer, 8),
|
|
||||||
}
|
|
||||||
},
|
|
||||||
},
|
|
||||||
}
|
}
|
||||||
|
|
||||||
storeOpcodeSet(typeptr, codeSet, opcodeMap)
|
storeOpcodeSet(typeptr, codeSet, opcodeMap)
|
||||||
p := uintptr(header.ptr)
|
p := uintptr(header.ptr)
|
||||||
ctx := codeSet.ctx.Get().(*encodeRuntimeContext)
|
ctx := e.ctx
|
||||||
ctx.init(p)
|
ctx.init(p, codeLength)
|
||||||
|
|
||||||
var c *opcode
|
var c *opcode
|
||||||
if e.enabledIndent {
|
if e.enabledIndent {
|
||||||
|
@ -239,55 +238,14 @@ func (e *Encoder) encode(v interface{}) error {
|
||||||
c = code
|
c = code
|
||||||
}
|
}
|
||||||
|
|
||||||
if err := e.run(ctx, c); err != nil {
|
b, err = e.run(ctx, b, c)
|
||||||
codeSet.ctx.Put(ctx)
|
if err != nil {
|
||||||
return err
|
return nil, err
|
||||||
}
|
}
|
||||||
codeSet.ctx.Put(ctx)
|
return b, nil
|
||||||
return nil
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeInt(v int) {
|
func encodeFloat32(b []byte, v float32) []byte {
|
||||||
e.encodeInt64(int64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeInt8(v int8) {
|
|
||||||
e.encodeInt64(int64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeInt16(v int16) {
|
|
||||||
e.encodeInt64(int64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeInt32(v int32) {
|
|
||||||
e.encodeInt64(int64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeInt64(v int64) {
|
|
||||||
e.buf = strconv.AppendInt(e.buf, v, 10)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeUint(v uint) {
|
|
||||||
e.encodeUint64(uint64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeUint8(v uint8) {
|
|
||||||
e.encodeUint64(uint64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeUint16(v uint16) {
|
|
||||||
e.encodeUint64(uint64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeUint32(v uint32) {
|
|
||||||
e.encodeUint64(uint64(v))
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeUint64(v uint64) {
|
|
||||||
e.buf = strconv.AppendUint(e.buf, v, 10)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeFloat32(v float32) {
|
|
||||||
f64 := float64(v)
|
f64 := float64(v)
|
||||||
abs := math.Abs(f64)
|
abs := math.Abs(f64)
|
||||||
fmt := byte('f')
|
fmt := byte('f')
|
||||||
|
@ -298,10 +256,10 @@ func (e *Encoder) encodeFloat32(v float32) {
|
||||||
fmt = 'e'
|
fmt = 'e'
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
e.buf = strconv.AppendFloat(e.buf, f64, fmt, -1, 32)
|
return strconv.AppendFloat(b, f64, fmt, -1, 32)
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeFloat64(v float64) {
|
func encodeFloat64(b []byte, v float64) []byte {
|
||||||
abs := math.Abs(v)
|
abs := math.Abs(v)
|
||||||
fmt := byte('f')
|
fmt := byte('f')
|
||||||
// Note: Must use float32 comparisons for underlying float32 value to get precise cutoffs right.
|
// Note: Must use float32 comparisons for underlying float32 value to get precise cutoffs right.
|
||||||
|
@ -310,58 +268,62 @@ func (e *Encoder) encodeFloat64(v float64) {
|
||||||
fmt = 'e'
|
fmt = 'e'
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
e.buf = strconv.AppendFloat(e.buf, v, fmt, -1, 64)
|
return strconv.AppendFloat(b, v, fmt, -1, 64)
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeBool(v bool) {
|
func encodeBool(b []byte, v bool) []byte {
|
||||||
e.buf = strconv.AppendBool(e.buf, v)
|
if v {
|
||||||
}
|
return append(b, "true"...)
|
||||||
|
|
||||||
func (e *Encoder) encodeBytes(b []byte) {
|
|
||||||
e.buf = append(e.buf, b...)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeNull() {
|
|
||||||
e.buf = append(e.buf, 'n', 'u', 'l', 'l')
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeKey(code *opcode) {
|
|
||||||
if e.enabledHTMLEscape {
|
|
||||||
e.encodeBytes(code.escapedKey)
|
|
||||||
} else {
|
|
||||||
e.encodeBytes(code.key)
|
|
||||||
}
|
}
|
||||||
|
return append(b, "false"...)
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeString(s string) {
|
func encodeBytes(dst []byte, src []byte) []byte {
|
||||||
|
return append(dst, src...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func encodeNull(b []byte) []byte {
|
||||||
|
return append(b, "null"...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func encodeComma(b []byte) []byte {
|
||||||
|
return append(b, ',')
|
||||||
|
}
|
||||||
|
|
||||||
|
func encodeIndentComma(b []byte) []byte {
|
||||||
|
return append(b, ',', '\n')
|
||||||
|
}
|
||||||
|
|
||||||
|
func (e *Encoder) encodeKey(b []byte, code *opcode) []byte {
|
||||||
if e.enabledHTMLEscape {
|
if e.enabledHTMLEscape {
|
||||||
e.encodeEscapedString(s)
|
return append(b, code.escapedKey...)
|
||||||
} else {
|
|
||||||
e.encodeNoEscapedString(s)
|
|
||||||
}
|
}
|
||||||
|
return append(b, code.key...)
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeByteSlice(b []byte) {
|
func (e *Encoder) encodeString(b []byte, s string) []byte {
|
||||||
encodedLen := base64.StdEncoding.EncodedLen(len(b))
|
if e.enabledHTMLEscape {
|
||||||
e.encodeByte('"')
|
return encodeEscapedString(b, s)
|
||||||
pos := len(e.buf)
|
}
|
||||||
remainLen := cap(e.buf[pos:])
|
return encodeNoEscapedString(b, s)
|
||||||
|
}
|
||||||
|
|
||||||
|
func encodeByteSlice(b []byte, src []byte) []byte {
|
||||||
|
encodedLen := base64.StdEncoding.EncodedLen(len(src))
|
||||||
|
b = append(b, '"')
|
||||||
|
pos := len(b)
|
||||||
|
remainLen := cap(b[pos:])
|
||||||
var buf []byte
|
var buf []byte
|
||||||
if remainLen > encodedLen {
|
if remainLen > encodedLen {
|
||||||
buf = e.buf[pos : pos+encodedLen]
|
buf = b[pos : pos+encodedLen]
|
||||||
} else {
|
} else {
|
||||||
buf = make([]byte, encodedLen)
|
buf = make([]byte, encodedLen)
|
||||||
}
|
}
|
||||||
base64.StdEncoding.Encode(buf, b)
|
base64.StdEncoding.Encode(buf, src)
|
||||||
e.encodeBytes(buf)
|
return append(append(b, buf...), '"')
|
||||||
e.encodeByte('"')
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) encodeByte(b byte) {
|
func (e *Encoder) encodeIndent(b []byte, indent int) []byte {
|
||||||
e.buf = append(e.buf, b)
|
b = append(b, e.prefix...)
|
||||||
}
|
return append(b, bytes.Repeat(e.indentStr, indent)...)
|
||||||
|
|
||||||
func (e *Encoder) encodeIndent(indent int) {
|
|
||||||
e.buf = append(e.buf, e.prefix...)
|
|
||||||
e.buf = append(e.buf, bytes.Repeat(e.indentStr, indent)...)
|
|
||||||
}
|
}
|
||||||
|
|
|
@ -1007,7 +1007,7 @@ func (e *Encoder) compileStruct(ctx *encodeCompileContext, isPtr bool) (*opcode,
|
||||||
|
|
||||||
var buf bytes.Buffer
|
var buf bytes.Buffer
|
||||||
enc := NewEncoder(&buf)
|
enc := NewEncoder(&buf)
|
||||||
enc.encodeEscapedString(tag.key)
|
enc.buf = encodeEscapedString(enc.buf, tag.key)
|
||||||
escapedKey := fmt.Sprintf(`%s:`, string(enc.buf))
|
escapedKey := fmt.Sprintf(`%s:`, string(enc.buf))
|
||||||
enc.release()
|
enc.release()
|
||||||
fieldCode := &opcode{
|
fieldCode := &opcode{
|
||||||
|
|
|
@ -88,7 +88,10 @@ type encodeRuntimeContext struct {
|
||||||
keepRefs []unsafe.Pointer
|
keepRefs []unsafe.Pointer
|
||||||
}
|
}
|
||||||
|
|
||||||
func (c *encodeRuntimeContext) init(p uintptr) {
|
func (c *encodeRuntimeContext) init(p uintptr, codelen int) {
|
||||||
|
if len(c.ptrs) < codelen {
|
||||||
|
c.ptrs = make([]uintptr, codelen)
|
||||||
|
}
|
||||||
c.ptrs[0] = p
|
c.ptrs[0] = p
|
||||||
c.keepRefs = c.keepRefs[:0]
|
c.keepRefs = c.keepRefs[:0]
|
||||||
}
|
}
|
||||||
|
|
|
@ -0,0 +1,98 @@
|
||||||
|
package json
|
||||||
|
|
||||||
|
import (
|
||||||
|
"unsafe"
|
||||||
|
)
|
||||||
|
|
||||||
|
var endianness int
|
||||||
|
|
||||||
|
func init() {
|
||||||
|
var b [2]byte
|
||||||
|
*(*uint16)(unsafe.Pointer(&b)) = uint16(0xABCD)
|
||||||
|
|
||||||
|
switch b[0] {
|
||||||
|
case 0xCD:
|
||||||
|
endianness = 0 // LE
|
||||||
|
case 0xAB:
|
||||||
|
endianness = 1 // BE
|
||||||
|
default:
|
||||||
|
panic("could not determine endianness")
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
// "00010203...96979899" cast to []uint16
|
||||||
|
var intLELookup = [100]uint16{
|
||||||
|
0x3030, 0x3130, 0x3230, 0x3330, 0x3430, 0x3530, 0x3630, 0x3730, 0x3830, 0x3930,
|
||||||
|
0x3031, 0x3131, 0x3231, 0x3331, 0x3431, 0x3531, 0x3631, 0x3731, 0x3831, 0x3931,
|
||||||
|
0x3032, 0x3132, 0x3232, 0x3332, 0x3432, 0x3532, 0x3632, 0x3732, 0x3832, 0x3932,
|
||||||
|
0x3033, 0x3133, 0x3233, 0x3333, 0x3433, 0x3533, 0x3633, 0x3733, 0x3833, 0x3933,
|
||||||
|
0x3034, 0x3134, 0x3234, 0x3334, 0x3434, 0x3534, 0x3634, 0x3734, 0x3834, 0x3934,
|
||||||
|
0x3035, 0x3135, 0x3235, 0x3335, 0x3435, 0x3535, 0x3635, 0x3735, 0x3835, 0x3935,
|
||||||
|
0x3036, 0x3136, 0x3236, 0x3336, 0x3436, 0x3536, 0x3636, 0x3736, 0x3836, 0x3936,
|
||||||
|
0x3037, 0x3137, 0x3237, 0x3337, 0x3437, 0x3537, 0x3637, 0x3737, 0x3837, 0x3937,
|
||||||
|
0x3038, 0x3138, 0x3238, 0x3338, 0x3438, 0x3538, 0x3638, 0x3738, 0x3838, 0x3938,
|
||||||
|
0x3039, 0x3139, 0x3239, 0x3339, 0x3439, 0x3539, 0x3639, 0x3739, 0x3839, 0x3939,
|
||||||
|
}
|
||||||
|
|
||||||
|
var intBELookup = [100]uint16{
|
||||||
|
0x3030, 0x3031, 0x3032, 0x3033, 0x3034, 0x3035, 0x3036, 0x3037, 0x3038, 0x3039,
|
||||||
|
0x3130, 0x3131, 0x3132, 0x3133, 0x3134, 0x3135, 0x3136, 0x3137, 0x3138, 0x3139,
|
||||||
|
0x3230, 0x3231, 0x3232, 0x3233, 0x3234, 0x3235, 0x3236, 0x3237, 0x3238, 0x3239,
|
||||||
|
0x3330, 0x3331, 0x3332, 0x3333, 0x3334, 0x3335, 0x3336, 0x3337, 0x3338, 0x3339,
|
||||||
|
0x3430, 0x3431, 0x3432, 0x3433, 0x3434, 0x3435, 0x3436, 0x3437, 0x3438, 0x3439,
|
||||||
|
0x3530, 0x3531, 0x3532, 0x3533, 0x3534, 0x3535, 0x3536, 0x3537, 0x3538, 0x3539,
|
||||||
|
0x3630, 0x3631, 0x3632, 0x3633, 0x3634, 0x3635, 0x3636, 0x3637, 0x3638, 0x3639,
|
||||||
|
0x3730, 0x3731, 0x3732, 0x3733, 0x3734, 0x3735, 0x3736, 0x3737, 0x3738, 0x3739,
|
||||||
|
0x3830, 0x3831, 0x3832, 0x3833, 0x3834, 0x3835, 0x3836, 0x3837, 0x3838, 0x3839,
|
||||||
|
0x3930, 0x3931, 0x3932, 0x3933, 0x3934, 0x3935, 0x3936, 0x3937, 0x3938, 0x3939,
|
||||||
|
}
|
||||||
|
|
||||||
|
var intLookup = [2]*[100]uint16{&intLELookup, &intBELookup}
|
||||||
|
|
||||||
|
func appendInt(b []byte, n int64) []byte {
|
||||||
|
return formatInteger(b, uint64(n), n < 0)
|
||||||
|
}
|
||||||
|
|
||||||
|
func appendUint(b []byte, n uint64) []byte {
|
||||||
|
return formatInteger(b, n, false)
|
||||||
|
}
|
||||||
|
|
||||||
|
func formatInteger(out []byte, n uint64, negative bool) []byte {
|
||||||
|
if !negative {
|
||||||
|
if n < 10 {
|
||||||
|
return append(out, byte(n+'0'))
|
||||||
|
} else if n < 100 {
|
||||||
|
u := intLELookup[n]
|
||||||
|
return append(out, byte(u), byte(u>>8))
|
||||||
|
}
|
||||||
|
} else {
|
||||||
|
n = -n
|
||||||
|
}
|
||||||
|
|
||||||
|
lookup := intLookup[endianness]
|
||||||
|
|
||||||
|
var b [22]byte
|
||||||
|
u := (*[11]uint16)(unsafe.Pointer(&b))
|
||||||
|
i := 11
|
||||||
|
|
||||||
|
for n >= 100 {
|
||||||
|
j := n % 100
|
||||||
|
n /= 100
|
||||||
|
i--
|
||||||
|
u[i] = lookup[j]
|
||||||
|
}
|
||||||
|
|
||||||
|
i--
|
||||||
|
u[i] = lookup[n]
|
||||||
|
|
||||||
|
i *= 2 // convert to byte index
|
||||||
|
if n < 10 {
|
||||||
|
i++ // remove leading zero
|
||||||
|
}
|
||||||
|
if negative {
|
||||||
|
i--
|
||||||
|
b[i] = '-'
|
||||||
|
}
|
||||||
|
|
||||||
|
return append(out, b[i:]...)
|
||||||
|
}
|
773
encode_string.go
773
encode_string.go
|
@ -1,9 +1,352 @@
|
||||||
package json
|
package json
|
||||||
|
|
||||||
import (
|
import (
|
||||||
|
"math/bits"
|
||||||
|
"reflect"
|
||||||
"unicode/utf8"
|
"unicode/utf8"
|
||||||
|
"unsafe"
|
||||||
)
|
)
|
||||||
|
|
||||||
|
const (
|
||||||
|
lsb = 0x0101010101010101
|
||||||
|
msb = 0x8080808080808080
|
||||||
|
)
|
||||||
|
|
||||||
|
var needEscapeWithHTML = [256]bool{
|
||||||
|
'"': true,
|
||||||
|
'&': true,
|
||||||
|
'<': true,
|
||||||
|
'>': true,
|
||||||
|
'\\': true,
|
||||||
|
0x00: true,
|
||||||
|
0x01: true,
|
||||||
|
0x02: true,
|
||||||
|
0x03: true,
|
||||||
|
0x04: true,
|
||||||
|
0x05: true,
|
||||||
|
0x06: true,
|
||||||
|
0x07: true,
|
||||||
|
0x08: true,
|
||||||
|
0x09: true,
|
||||||
|
0x0a: true,
|
||||||
|
0x0b: true,
|
||||||
|
0x0c: true,
|
||||||
|
0x0d: true,
|
||||||
|
0x0e: true,
|
||||||
|
0x0f: true,
|
||||||
|
0x10: true,
|
||||||
|
0x11: true,
|
||||||
|
0x12: true,
|
||||||
|
0x13: true,
|
||||||
|
0x14: true,
|
||||||
|
0x15: true,
|
||||||
|
0x16: true,
|
||||||
|
0x17: true,
|
||||||
|
0x18: true,
|
||||||
|
0x19: true,
|
||||||
|
0x1a: true,
|
||||||
|
0x1b: true,
|
||||||
|
0x1c: true,
|
||||||
|
0x1d: true,
|
||||||
|
0x1e: true,
|
||||||
|
0x1f: true,
|
||||||
|
/* 0x20 - 0x7f */
|
||||||
|
0x80: true,
|
||||||
|
0x81: true,
|
||||||
|
0x82: true,
|
||||||
|
0x83: true,
|
||||||
|
0x84: true,
|
||||||
|
0x85: true,
|
||||||
|
0x86: true,
|
||||||
|
0x87: true,
|
||||||
|
0x88: true,
|
||||||
|
0x89: true,
|
||||||
|
0x8a: true,
|
||||||
|
0x8b: true,
|
||||||
|
0x8c: true,
|
||||||
|
0x8d: true,
|
||||||
|
0x8e: true,
|
||||||
|
0x8f: true,
|
||||||
|
0x90: true,
|
||||||
|
0x91: true,
|
||||||
|
0x92: true,
|
||||||
|
0x93: true,
|
||||||
|
0x94: true,
|
||||||
|
0x95: true,
|
||||||
|
0x96: true,
|
||||||
|
0x97: true,
|
||||||
|
0x98: true,
|
||||||
|
0x99: true,
|
||||||
|
0x9a: true,
|
||||||
|
0x9b: true,
|
||||||
|
0x9c: true,
|
||||||
|
0x9d: true,
|
||||||
|
0x9e: true,
|
||||||
|
0x9f: true,
|
||||||
|
0xa0: true,
|
||||||
|
0xa1: true,
|
||||||
|
0xa2: true,
|
||||||
|
0xa3: true,
|
||||||
|
0xa4: true,
|
||||||
|
0xa5: true,
|
||||||
|
0xa6: true,
|
||||||
|
0xa7: true,
|
||||||
|
0xa8: true,
|
||||||
|
0xa9: true,
|
||||||
|
0xaa: true,
|
||||||
|
0xab: true,
|
||||||
|
0xac: true,
|
||||||
|
0xad: true,
|
||||||
|
0xae: true,
|
||||||
|
0xaf: true,
|
||||||
|
0xb0: true,
|
||||||
|
0xb1: true,
|
||||||
|
0xb2: true,
|
||||||
|
0xb3: true,
|
||||||
|
0xb4: true,
|
||||||
|
0xb5: true,
|
||||||
|
0xb6: true,
|
||||||
|
0xb7: true,
|
||||||
|
0xb8: true,
|
||||||
|
0xb9: true,
|
||||||
|
0xba: true,
|
||||||
|
0xbb: true,
|
||||||
|
0xbc: true,
|
||||||
|
0xbd: true,
|
||||||
|
0xbe: true,
|
||||||
|
0xbf: true,
|
||||||
|
0xc0: true,
|
||||||
|
0xc1: true,
|
||||||
|
0xc2: true,
|
||||||
|
0xc3: true,
|
||||||
|
0xc4: true,
|
||||||
|
0xc5: true,
|
||||||
|
0xc6: true,
|
||||||
|
0xc7: true,
|
||||||
|
0xc8: true,
|
||||||
|
0xc9: true,
|
||||||
|
0xca: true,
|
||||||
|
0xcb: true,
|
||||||
|
0xcc: true,
|
||||||
|
0xcd: true,
|
||||||
|
0xce: true,
|
||||||
|
0xcf: true,
|
||||||
|
0xd0: true,
|
||||||
|
0xd1: true,
|
||||||
|
0xd2: true,
|
||||||
|
0xd3: true,
|
||||||
|
0xd4: true,
|
||||||
|
0xd5: true,
|
||||||
|
0xd6: true,
|
||||||
|
0xd7: true,
|
||||||
|
0xd8: true,
|
||||||
|
0xd9: true,
|
||||||
|
0xda: true,
|
||||||
|
0xdb: true,
|
||||||
|
0xdc: true,
|
||||||
|
0xdd: true,
|
||||||
|
0xde: true,
|
||||||
|
0xdf: true,
|
||||||
|
0xe0: true,
|
||||||
|
0xe1: true,
|
||||||
|
0xe2: true,
|
||||||
|
0xe3: true,
|
||||||
|
0xe4: true,
|
||||||
|
0xe5: true,
|
||||||
|
0xe6: true,
|
||||||
|
0xe7: true,
|
||||||
|
0xe8: true,
|
||||||
|
0xe9: true,
|
||||||
|
0xea: true,
|
||||||
|
0xeb: true,
|
||||||
|
0xec: true,
|
||||||
|
0xed: true,
|
||||||
|
0xee: true,
|
||||||
|
0xef: true,
|
||||||
|
0xf0: true,
|
||||||
|
0xf1: true,
|
||||||
|
0xf2: true,
|
||||||
|
0xf3: true,
|
||||||
|
0xf4: true,
|
||||||
|
0xf5: true,
|
||||||
|
0xf6: true,
|
||||||
|
0xf7: true,
|
||||||
|
0xf8: true,
|
||||||
|
0xf9: true,
|
||||||
|
0xfa: true,
|
||||||
|
0xfb: true,
|
||||||
|
0xfc: true,
|
||||||
|
0xfd: true,
|
||||||
|
0xfe: true,
|
||||||
|
0xff: true,
|
||||||
|
}
|
||||||
|
|
||||||
|
var needEscape = [256]bool{
|
||||||
|
'"': true,
|
||||||
|
'\\': true,
|
||||||
|
0x00: true,
|
||||||
|
0x01: true,
|
||||||
|
0x02: true,
|
||||||
|
0x03: true,
|
||||||
|
0x04: true,
|
||||||
|
0x05: true,
|
||||||
|
0x06: true,
|
||||||
|
0x07: true,
|
||||||
|
0x08: true,
|
||||||
|
0x09: true,
|
||||||
|
0x0a: true,
|
||||||
|
0x0b: true,
|
||||||
|
0x0c: true,
|
||||||
|
0x0d: true,
|
||||||
|
0x0e: true,
|
||||||
|
0x0f: true,
|
||||||
|
0x10: true,
|
||||||
|
0x11: true,
|
||||||
|
0x12: true,
|
||||||
|
0x13: true,
|
||||||
|
0x14: true,
|
||||||
|
0x15: true,
|
||||||
|
0x16: true,
|
||||||
|
0x17: true,
|
||||||
|
0x18: true,
|
||||||
|
0x19: true,
|
||||||
|
0x1a: true,
|
||||||
|
0x1b: true,
|
||||||
|
0x1c: true,
|
||||||
|
0x1d: true,
|
||||||
|
0x1e: true,
|
||||||
|
0x1f: true,
|
||||||
|
/* 0x20 - 0x7f */
|
||||||
|
0x80: true,
|
||||||
|
0x81: true,
|
||||||
|
0x82: true,
|
||||||
|
0x83: true,
|
||||||
|
0x84: true,
|
||||||
|
0x85: true,
|
||||||
|
0x86: true,
|
||||||
|
0x87: true,
|
||||||
|
0x88: true,
|
||||||
|
0x89: true,
|
||||||
|
0x8a: true,
|
||||||
|
0x8b: true,
|
||||||
|
0x8c: true,
|
||||||
|
0x8d: true,
|
||||||
|
0x8e: true,
|
||||||
|
0x8f: true,
|
||||||
|
0x90: true,
|
||||||
|
0x91: true,
|
||||||
|
0x92: true,
|
||||||
|
0x93: true,
|
||||||
|
0x94: true,
|
||||||
|
0x95: true,
|
||||||
|
0x96: true,
|
||||||
|
0x97: true,
|
||||||
|
0x98: true,
|
||||||
|
0x99: true,
|
||||||
|
0x9a: true,
|
||||||
|
0x9b: true,
|
||||||
|
0x9c: true,
|
||||||
|
0x9d: true,
|
||||||
|
0x9e: true,
|
||||||
|
0x9f: true,
|
||||||
|
0xa0: true,
|
||||||
|
0xa1: true,
|
||||||
|
0xa2: true,
|
||||||
|
0xa3: true,
|
||||||
|
0xa4: true,
|
||||||
|
0xa5: true,
|
||||||
|
0xa6: true,
|
||||||
|
0xa7: true,
|
||||||
|
0xa8: true,
|
||||||
|
0xa9: true,
|
||||||
|
0xaa: true,
|
||||||
|
0xab: true,
|
||||||
|
0xac: true,
|
||||||
|
0xad: true,
|
||||||
|
0xae: true,
|
||||||
|
0xaf: true,
|
||||||
|
0xb0: true,
|
||||||
|
0xb1: true,
|
||||||
|
0xb2: true,
|
||||||
|
0xb3: true,
|
||||||
|
0xb4: true,
|
||||||
|
0xb5: true,
|
||||||
|
0xb6: true,
|
||||||
|
0xb7: true,
|
||||||
|
0xb8: true,
|
||||||
|
0xb9: true,
|
||||||
|
0xba: true,
|
||||||
|
0xbb: true,
|
||||||
|
0xbc: true,
|
||||||
|
0xbd: true,
|
||||||
|
0xbe: true,
|
||||||
|
0xbf: true,
|
||||||
|
0xc0: true,
|
||||||
|
0xc1: true,
|
||||||
|
0xc2: true,
|
||||||
|
0xc3: true,
|
||||||
|
0xc4: true,
|
||||||
|
0xc5: true,
|
||||||
|
0xc6: true,
|
||||||
|
0xc7: true,
|
||||||
|
0xc8: true,
|
||||||
|
0xc9: true,
|
||||||
|
0xca: true,
|
||||||
|
0xcb: true,
|
||||||
|
0xcc: true,
|
||||||
|
0xcd: true,
|
||||||
|
0xce: true,
|
||||||
|
0xcf: true,
|
||||||
|
0xd0: true,
|
||||||
|
0xd1: true,
|
||||||
|
0xd2: true,
|
||||||
|
0xd3: true,
|
||||||
|
0xd4: true,
|
||||||
|
0xd5: true,
|
||||||
|
0xd6: true,
|
||||||
|
0xd7: true,
|
||||||
|
0xd8: true,
|
||||||
|
0xd9: true,
|
||||||
|
0xda: true,
|
||||||
|
0xdb: true,
|
||||||
|
0xdc: true,
|
||||||
|
0xdd: true,
|
||||||
|
0xde: true,
|
||||||
|
0xdf: true,
|
||||||
|
0xe0: true,
|
||||||
|
0xe1: true,
|
||||||
|
0xe2: true,
|
||||||
|
0xe3: true,
|
||||||
|
0xe4: true,
|
||||||
|
0xe5: true,
|
||||||
|
0xe6: true,
|
||||||
|
0xe7: true,
|
||||||
|
0xe8: true,
|
||||||
|
0xe9: true,
|
||||||
|
0xea: true,
|
||||||
|
0xeb: true,
|
||||||
|
0xec: true,
|
||||||
|
0xed: true,
|
||||||
|
0xee: true,
|
||||||
|
0xef: true,
|
||||||
|
0xf0: true,
|
||||||
|
0xf1: true,
|
||||||
|
0xf2: true,
|
||||||
|
0xf3: true,
|
||||||
|
0xf4: true,
|
||||||
|
0xf5: true,
|
||||||
|
0xf6: true,
|
||||||
|
0xf7: true,
|
||||||
|
0xf8: true,
|
||||||
|
0xf9: true,
|
||||||
|
0xfa: true,
|
||||||
|
0xfb: true,
|
||||||
|
0xfc: true,
|
||||||
|
0xfd: true,
|
||||||
|
0xfe: true,
|
||||||
|
0xff: true,
|
||||||
|
}
|
||||||
|
|
||||||
// htmlSafeSet holds the value true if the ASCII character with the given
|
// htmlSafeSet holds the value true if the ASCII character with the given
|
||||||
// array position can be safely represented inside a JSON string, embedded
|
// array position can be safely represented inside a JSON string, embedded
|
||||||
// inside of HTML <script> tags, without any additional escaping.
|
// inside of HTML <script> tags, without any additional escaping.
|
||||||
|
@ -345,154 +688,320 @@ var safeSet = [utf8.RuneSelf]bool{
|
||||||
|
|
||||||
var hex = "0123456789abcdef"
|
var hex = "0123456789abcdef"
|
||||||
|
|
||||||
func (e *Encoder) encodeEscapedString(s string) {
|
// escapeIndex finds the index of the first char in `s` that requires escaping.
|
||||||
|
// A char requires escaping if it's outside of the range of [0x20, 0x7F] or if
|
||||||
|
// it includes a double quote or backslash.
|
||||||
|
// If no chars in `s` require escaping, the return value is -1.
|
||||||
|
func escapeIndex(s string) int {
|
||||||
|
chunks := stringToUint64Slice(s)
|
||||||
|
for _, n := range chunks {
|
||||||
|
// combine masks before checking for the MSB of each byte. We include
|
||||||
|
// `n` in the mask to check whether any of the *input* byte MSBs were
|
||||||
|
// set (i.e. the byte was outside the ASCII range).
|
||||||
|
mask := n | below(n, 0x20) | contains(n, '"') | contains(n, '\\')
|
||||||
|
if (mask & msb) != 0 {
|
||||||
|
return bits.TrailingZeros64(mask&msb) / 8
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
valLen := len(s)
|
valLen := len(s)
|
||||||
// write string, the fast path, without utf8 and escape support
|
for i := len(chunks) * 8; i < valLen; i++ {
|
||||||
i := 0
|
if needEscape[s[i]] {
|
||||||
for ; i < valLen; i++ {
|
return i
|
||||||
if !htmlSafeSet[s[i]] {
|
|
||||||
break
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
e.buf = append(e.buf, '"')
|
|
||||||
if i == valLen {
|
return -1
|
||||||
e.buf = append(e.buf, s...)
|
|
||||||
e.buf = append(e.buf, '"')
|
|
||||||
return
|
|
||||||
}
|
|
||||||
e.buf = append(e.buf, s[:i]...)
|
|
||||||
e.writeStringSlowPathWithHTMLEscaped(i, s, valLen)
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) writeStringSlowPathWithHTMLEscaped(i int, s string, valLen int) {
|
// escapeIndex finds the index of the first char in `s` that requires escaping.
|
||||||
start := i
|
// A char requires escaping if it's outside of the range of [0x20, 0x7F] or if
|
||||||
// for the remaining parts, we process them char by char
|
// it includes a double quote or backslash.
|
||||||
for i < valLen {
|
// Also, the chars <, > and & require escaping.
|
||||||
if b := s[i]; b < utf8.RuneSelf {
|
// If no chars in `s` require escaping, the return value is -1.
|
||||||
if htmlSafeSet[b] {
|
func escapeIndexWithHTMLEscape(s string) int {
|
||||||
i++
|
chunks := stringToUint64Slice(s)
|
||||||
continue
|
for _, n := range chunks {
|
||||||
}
|
// combine masks before checking for the MSB of each byte. We include
|
||||||
if start < i {
|
// `n` in the mask to check whether any of the *input* byte MSBs were
|
||||||
e.buf = append(e.buf, s[start:i]...)
|
// set (i.e. the byte was outside the ASCII range).
|
||||||
}
|
mask := n | (n - (lsb * 0x20)) |
|
||||||
switch b {
|
((n ^ (lsb * '"')) - lsb) |
|
||||||
case '\\', '"':
|
((n ^ (lsb * '\\')) - lsb) |
|
||||||
e.buf = append(e.buf, '\\', b)
|
((n ^ (lsb * '<')) - lsb) |
|
||||||
case '\n':
|
((n ^ (lsb * '>')) - lsb) |
|
||||||
e.buf = append(e.buf, '\\', 'n')
|
((n ^ (lsb * '&')) - lsb)
|
||||||
case '\r':
|
if (mask & msb) != 0 {
|
||||||
e.buf = append(e.buf, '\\', 'r')
|
return bits.TrailingZeros64(mask&msb) / 8
|
||||||
case '\t':
|
|
||||||
e.buf = append(e.buf, '\\', 't')
|
|
||||||
default:
|
|
||||||
// This encodes bytes < 0x20 except for \t, \n and \r.
|
|
||||||
// If escapeHTML is set, it also escapes <, >, and &
|
|
||||||
// because they can lead to security holes when
|
|
||||||
// user-controlled strings are rendered into JSON
|
|
||||||
// and served to some browsers.
|
|
||||||
e.buf = append(e.buf, `\u00`...)
|
|
||||||
e.buf = append(e.buf, hex[b>>4], hex[b&0xF])
|
|
||||||
}
|
|
||||||
i++
|
|
||||||
start = i
|
|
||||||
continue
|
|
||||||
}
|
}
|
||||||
c, size := utf8.DecodeRuneInString(s[i:])
|
|
||||||
if c == utf8.RuneError && size == 1 {
|
|
||||||
if start < i {
|
|
||||||
e.buf = append(e.buf, s[start:i]...)
|
|
||||||
}
|
|
||||||
e.buf = append(e.buf, `\ufffd`...)
|
|
||||||
i++
|
|
||||||
start = i
|
|
||||||
continue
|
|
||||||
}
|
|
||||||
// U+2028 is LINE SEPARATOR.
|
|
||||||
// U+2029 is PARAGRAPH SEPARATOR.
|
|
||||||
// They are both technically valid characters in JSON strings,
|
|
||||||
// but don't work in JSONP, which has to be evaluated as JavaScript,
|
|
||||||
// and can lead to security holes there. It is valid JSON to
|
|
||||||
// escape them, so we do so unconditionally.
|
|
||||||
// See http://timelessrepo.com/json-isnt-a-javascript-subset for discussion.
|
|
||||||
if c == '\u2028' || c == '\u2029' {
|
|
||||||
if start < i {
|
|
||||||
e.buf = append(e.buf, s[start:i]...)
|
|
||||||
}
|
|
||||||
e.buf = append(e.buf, `\u202`...)
|
|
||||||
e.buf = append(e.buf, hex[c&0xF])
|
|
||||||
i += size
|
|
||||||
start = i
|
|
||||||
continue
|
|
||||||
}
|
|
||||||
i += size
|
|
||||||
}
|
}
|
||||||
if start < len(s) {
|
|
||||||
e.buf = append(e.buf, s[start:]...)
|
|
||||||
}
|
|
||||||
e.buf = append(e.buf, '"')
|
|
||||||
}
|
|
||||||
|
|
||||||
func (e *Encoder) encodeNoEscapedString(s string) {
|
|
||||||
valLen := len(s)
|
valLen := len(s)
|
||||||
|
for i := len(chunks) * 8; i < valLen; i++ {
|
||||||
// write string, the fast path, without utf8 and escape support
|
if needEscapeWithHTML[s[i]] {
|
||||||
i := 0
|
return i
|
||||||
for ; i < valLen; i++ {
|
|
||||||
c := s[i]
|
|
||||||
if c <= 31 || c == '"' || c == '\\' {
|
|
||||||
break
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
e.buf = append(e.buf, '"')
|
|
||||||
if i == valLen {
|
return -1
|
||||||
e.buf = append(e.buf, s...)
|
|
||||||
e.buf = append(e.buf, '"')
|
|
||||||
return
|
|
||||||
}
|
|
||||||
e.buf = append(e.buf, s[:i]...)
|
|
||||||
e.writeStringSlowPath(i, s, valLen)
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e *Encoder) writeStringSlowPath(i int, s string, valLen int) {
|
// below return a mask that can be used to determine if any of the bytes
|
||||||
start := i
|
// in `n` are below `b`. If a byte's MSB is set in the mask then that byte was
|
||||||
// for the remaining parts, we process them char by char
|
// below `b`. The result is only valid if `b`, and each byte in `n`, is below
|
||||||
for i < valLen {
|
// 0x80.
|
||||||
if b := s[i]; b < utf8.RuneSelf {
|
func below(n uint64, b byte) uint64 {
|
||||||
if safeSet[b] {
|
return n - expand(b)
|
||||||
i++
|
}
|
||||||
continue
|
|
||||||
|
// contains returns a mask that can be used to determine if any of the
|
||||||
|
// bytes in `n` are equal to `b`. If a byte's MSB is set in the mask then
|
||||||
|
// that byte is equal to `b`. The result is only valid if `b`, and each
|
||||||
|
// byte in `n`, is below 0x80.
|
||||||
|
func contains(n uint64, b byte) uint64 {
|
||||||
|
return (n ^ expand(b)) - lsb
|
||||||
|
}
|
||||||
|
|
||||||
|
// expand puts the specified byte into each of the 8 bytes of a uint64.
|
||||||
|
func expand(b byte) uint64 {
|
||||||
|
return lsb * uint64(b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func stringToUint64Slice(s string) []uint64 {
|
||||||
|
return *(*[]uint64)(unsafe.Pointer(&reflect.SliceHeader{
|
||||||
|
Data: ((*reflect.StringHeader)(unsafe.Pointer(&s))).Data,
|
||||||
|
Len: len(s) / 8,
|
||||||
|
Cap: len(s) / 8,
|
||||||
|
}))
|
||||||
|
}
|
||||||
|
|
||||||
|
func encodeEscapedString(buf []byte, s string) []byte {
|
||||||
|
valLen := len(s)
|
||||||
|
if valLen == 0 {
|
||||||
|
return append(buf, `""`...)
|
||||||
|
}
|
||||||
|
buf = append(buf, '"')
|
||||||
|
var (
|
||||||
|
i, j int
|
||||||
|
)
|
||||||
|
if valLen >= 8 {
|
||||||
|
chunks := stringToUint64Slice(s)
|
||||||
|
for _, n := range chunks {
|
||||||
|
// combine masks before checking for the MSB of each byte. We include
|
||||||
|
// `n` in the mask to check whether any of the *input* byte MSBs were
|
||||||
|
// set (i.e. the byte was outside the ASCII range).
|
||||||
|
mask := n | (n - (lsb * 0x20)) |
|
||||||
|
((n ^ (lsb * '"')) - lsb) |
|
||||||
|
((n ^ (lsb * '\\')) - lsb) |
|
||||||
|
((n ^ (lsb * '<')) - lsb) |
|
||||||
|
((n ^ (lsb * '>')) - lsb) |
|
||||||
|
((n ^ (lsb * '&')) - lsb)
|
||||||
|
if (mask & msb) != 0 {
|
||||||
|
j = bits.TrailingZeros64(mask&msb) / 8
|
||||||
|
goto ESCAPE_END
|
||||||
}
|
}
|
||||||
if start < i {
|
}
|
||||||
e.buf = append(e.buf, s[start:i]...)
|
for i := len(chunks) * 8; i < valLen; i++ {
|
||||||
|
if needEscapeWithHTML[s[i]] {
|
||||||
|
j = i
|
||||||
|
goto ESCAPE_END
|
||||||
}
|
}
|
||||||
switch b {
|
}
|
||||||
case '\\', '"':
|
// no found any escape characters.
|
||||||
e.buf = append(e.buf, '\\', b)
|
return append(append(buf, s...), '"')
|
||||||
case '\n':
|
}
|
||||||
e.buf = append(e.buf, '\\', 'n')
|
ESCAPE_END:
|
||||||
case '\r':
|
for j < valLen {
|
||||||
e.buf = append(e.buf, '\\', 'r')
|
c := s[j]
|
||||||
case '\t':
|
|
||||||
e.buf = append(e.buf, '\\', 't')
|
if !needEscapeWithHTML[c] {
|
||||||
default:
|
// fast path: most of the time, printable ascii characters are used
|
||||||
// This encodes bytes < 0x20 except for \t, \n and \r.
|
j++
|
||||||
// If escapeHTML is set, it also escapes <, >, and &
|
|
||||||
// because they can lead to security holes when
|
|
||||||
// user-controlled strings are rendered into JSON
|
|
||||||
// and served to some browsers.
|
|
||||||
e.buf = append(e.buf, []byte(`\u00`)...)
|
|
||||||
e.buf = append(e.buf, hex[b>>4], hex[b&0xF])
|
|
||||||
}
|
|
||||||
i++
|
|
||||||
start = i
|
|
||||||
continue
|
continue
|
||||||
}
|
}
|
||||||
i++
|
|
||||||
continue
|
switch c {
|
||||||
|
case '\\', '"':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', c)
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '\n':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', 'n')
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '\r':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', 'r')
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '\t':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', 't')
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '<', '>', '&':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\u00`...)
|
||||||
|
buf = append(buf, hex[c>>4], hex[c&0xF])
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
// This encodes bytes < 0x20 except for \t, \n and \r.
|
||||||
|
if c < 0x20 {
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\u00`...)
|
||||||
|
buf = append(buf, hex[c>>4], hex[c&0xF])
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
r, size := utf8.DecodeRuneInString(s[j:])
|
||||||
|
|
||||||
|
if r == utf8.RuneError && size == 1 {
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\ufffd`...)
|
||||||
|
i = j + size
|
||||||
|
j = j + size
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
switch r {
|
||||||
|
case '\u2028', '\u2029':
|
||||||
|
// U+2028 is LINE SEPARATOR.
|
||||||
|
// U+2029 is PARAGRAPH SEPARATOR.
|
||||||
|
// They are both technically valid characters in JSON strings,
|
||||||
|
// but don't work in JSONP, which has to be evaluated as JavaScript,
|
||||||
|
// and can lead to security holes there. It is valid JSON to
|
||||||
|
// escape them, so we do so unconditionally.
|
||||||
|
// See http://timelessrepo.com/json-isnt-a-javascript-subset for discussion.
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\u202`...)
|
||||||
|
buf = append(buf, hex[r&0xF])
|
||||||
|
i = j + size
|
||||||
|
j = j + size
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
j += size
|
||||||
}
|
}
|
||||||
if start < len(s) {
|
|
||||||
e.buf = append(e.buf, s[start:]...)
|
return append(append(buf, s[i:]...), '"')
|
||||||
}
|
}
|
||||||
e.buf = append(e.buf, '"')
|
|
||||||
|
func encodeNoEscapedString(buf []byte, s string) []byte {
|
||||||
|
valLen := len(s)
|
||||||
|
if valLen == 0 {
|
||||||
|
return append(buf, `""`...)
|
||||||
|
}
|
||||||
|
buf = append(buf, '"')
|
||||||
|
var escapeIdx int
|
||||||
|
if valLen >= 8 {
|
||||||
|
if escapeIdx = escapeIndex(s); escapeIdx < 0 {
|
||||||
|
return append(append(buf, s...), '"')
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
i := 0
|
||||||
|
j := escapeIdx
|
||||||
|
for j < valLen {
|
||||||
|
c := s[j]
|
||||||
|
|
||||||
|
if c >= 0x20 && c <= 0x7f && c != '\\' && c != '"' {
|
||||||
|
// fast path: most of the time, printable ascii characters are used
|
||||||
|
j++
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
switch c {
|
||||||
|
case '\\', '"':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', c)
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '\n':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', 'n')
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '\r':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', 'r')
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '\t':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, '\\', 't')
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
|
||||||
|
case '<', '>', '&':
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\u00`...)
|
||||||
|
buf = append(buf, hex[c>>4], hex[c&0xF])
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
// This encodes bytes < 0x20 except for \t, \n and \r.
|
||||||
|
if c < 0x20 {
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\u00`...)
|
||||||
|
buf = append(buf, hex[c>>4], hex[c&0xF])
|
||||||
|
i = j + 1
|
||||||
|
j = j + 1
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
r, size := utf8.DecodeRuneInString(s[j:])
|
||||||
|
|
||||||
|
if r == utf8.RuneError && size == 1 {
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\ufffd`...)
|
||||||
|
i = j + size
|
||||||
|
j = j + size
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
switch r {
|
||||||
|
case '\u2028', '\u2029':
|
||||||
|
// U+2028 is LINE SEPARATOR.
|
||||||
|
// U+2029 is PARAGRAPH SEPARATOR.
|
||||||
|
// They are both technically valid characters in JSON strings,
|
||||||
|
// but don't work in JSONP, which has to be evaluated as JavaScript,
|
||||||
|
// and can lead to security holes there. It is valid JSON to
|
||||||
|
// escape them, so we do so unconditionally.
|
||||||
|
// See http://timelessrepo.com/json-isnt-a-javascript-subset for discussion.
|
||||||
|
buf = append(buf, s[i:j]...)
|
||||||
|
buf = append(buf, `\u202`...)
|
||||||
|
buf = append(buf, hex[r&0xF])
|
||||||
|
i = j + size
|
||||||
|
j = j + size
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
j += size
|
||||||
|
}
|
||||||
|
|
||||||
|
return append(append(buf, s[i:]...), '"')
|
||||||
}
|
}
|
||||||
|
|
3697
encode_vm.go
3697
encode_vm.go
File diff suppressed because it is too large
Load Diff
2
json.go
2
json.go
|
@ -393,7 +393,7 @@ func HTMLEscape(dst *bytes.Buffer, src []byte) {
|
||||||
}
|
}
|
||||||
enc := NewEncoder(dst)
|
enc := NewEncoder(dst)
|
||||||
enc.SetEscapeHTML(true)
|
enc.SetEscapeHTML(true)
|
||||||
enc.encode(v)
|
enc.buf, _ = enc.encode(v)
|
||||||
dst.Write(enc.buf[:len(enc.buf)-1]) // remove last ',' character
|
dst.Write(enc.buf[:len(enc.buf)-1]) // remove last ',' character
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
Loading…
Reference in New Issue