Massively speed up low-level SFTP read/write

This doesn't impact most users who perform reads/writes using SFTPClient.get(fo)/put(fo) as those naturally perform chunking. However, users accessing the raw SFTPFile objects via SFTPClient.open() and then reading/writing large (more than a few MB) files, may experience severe slowdown due to inefficient slicing of the file being read/written. This change replaces the naive "slice a list of bytes" code with bytearray and memoryview, which are significantly more performant in these use cases, while remaining backwards compatible. Patch courtesy of Sevastian Tchernov.
author: Jeff Forcier <jeff@bitprophet.org> 2022-03-07 16:21:28 -0500
committer: Jeff Forcier <jeff@bitprophet.org> 2022-03-07 16:31:01 -0500
commit: b4bd81dce17d23b3e402b7fd492bb2ebd30b284c (patch)
tree: 2f170aa96d422c7258229171ef51d731754a27a2 /paramiko/file.py
parent: 60b4d1e025044090fea16de076dd0dbfb31e7f1d (diff)
download: paramiko-b4bd81dce17d23b3e402b7fd492bb2ebd30b284c.tar.gz
1 files changed, 5 insertions, 4 deletions
diff --git a/paramiko/file.py b/paramiko/file.py
index 9e9f6eb8..9dd9e9e7 100644
--- a/paramiko/file.py
+++ b/paramiko/file.py
@@ -192,7 +192,7 @@ class BufferedFile(ClosingContextManager):
             raise IOError("File is not open for reading")
         if (size is None) or (size < 0):
             # go for broke
-            result = self._rbuffer
+            result = bytearray(self._rbuffer)
             self._rbuffer = bytes()
             self._pos += len(result)
             while True:
@@ -202,10 +202,10 @@ class BufferedFile(ClosingContextManager):
                     new_data = None
                 if (new_data is None) or (len(new_data) == 0):
                     break
-                result += new_data
+                result.extend(new_data)
                 self._realpos += len(new_data)
                 self._pos += len(new_data)
-            return result
+            return bytes(result)
         if size <= len(self._rbuffer):
             result = self._rbuffer[:size]
             self._rbuffer = self._rbuffer[size:]
@@ -515,9 +515,10 @@ class BufferedFile(ClosingContextManager):
             # <http://www.python.org/doc/current/lib/built-in-funcs.html>
             self.newlines = None
 
-    def _write_all(self, data):
+    def _write_all(self, raw_data):
         # the underlying stream may be something that does partial writes (like
         # a socket).
+        data = memoryview(raw_data)
         while len(data) > 0:
             count = self._write(data)
             data = data[count:]
author	Jeff Forcier <jeff@bitprophet.org>	2022-03-07 16:21:28 -0500
committer	Jeff Forcier <jeff@bitprophet.org>	2022-03-07 16:31:01 -0500
commit	b4bd81dce17d23b3e402b7fd492bb2ebd30b284c (patch)
tree	2f170aa96d422c7258229171ef51d731754a27a2 /paramiko/file.py
parent	60b4d1e025044090fea16de076dd0dbfb31e7f1d (diff)
download	paramiko-b4bd81dce17d23b3e402b7fd492bb2ebd30b284c.tar.gz